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Polypeptides impliques dans la biosynthese pes spiramycines, sequences 
nucleqtidiques cod ant ces polypeptides et leurs applications 



5 La presente invention concerne l'isolement et Identification de nouveaux genes de 

la voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans 
cette biosynthese. Elle est egalement relative a 1'utilisation de ces genes dans le but 
d'augmenter les taux de production et la purete de la spiramycine produite. 

L'invention a egalement trait a 1'utilisation de ces genes pour la construction de 
10 mutants pouvant conduire a la synthese de nouveaux antibiotiques ou a des formes 
derivees de spiramycines. L'invention concerne encore les molecules produites grace a 
l'expression de ces genes et enfin des compositions pharmacologiquement actives d'une 
molecule produite grace a l'expression de tels genes. 

Les Streptomyces sont des bacteries filamenteuses Gram positif du sol. Elles 
15 jouent un role important dans la decomposition et la mineralisation des matieres 
organiques grace a la grande diversite des enzymes degradatives qu ! elles secretent. Elles 
presentent des phenomenes de differentiations morphologiques uniques chez les 
procaryotes s'accompagnant d'une differentiation metabolique caracterisee par la 
production de metabolites secondares presentant une extraordinaire diversite de 
20 structures chimiques et d'activites biologiques. Parmi ces metabolites, on retrouve les 
spiramycines produites a l'etat naturel par la bacterie Streptomyces ambofaciem. 

La spiramycine est un antibiotique de la famille des macrolides utile aussi bien en 
medecine veterinaire qu'en medecine humaine. Les macrolides sont caracterises par la 
presence d'un cycle lactone sur lequel sont greffes un ou plusieurs sucres. Streptomyces 
25 ambofaciens produit a l'etat naturel la spiramycine I, II et HI (cf. Figure 1), cependant 
l'activite antibiotique de la spiramycine I est nettement superieure a celle des 
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spiramycines II et HI (Liu et aL, 1999). La molecule de spiramycine I est constitute d'un 
macro-cycle lactonique, appelle platenolide et de trois sucres : la forosamine, le 
mycaminose et le mycarose (cf. Figure 1). L'activite antibiotique des spiramycines est 
due a une inhibition de la synthese proteique chez les procaryotes par un mecanisme 
5 impliquant la liaison de 1' antibiotique au ribosome bacterien. 

Certains composes membres de la famille des macrolides et possedant egalement 
un cycle lactone ont donne lieu a des utilisations hors du domaine des antibiotiques. 
Ainsi le produit FK506 a des effets immunosuppresseurs et offre des perspectives 
d'application therapeutique dans le domaine de la transplantation d'organe, de rarthrite 
10 rhumatoi'de et plus generalement dans des pathologies liees a des reactions 
autoimmunes. D'autres macrolides comme l'avermectine ont des activites insecticides et 
anti-helminthiques. 

De nombreuses voies de biosynthese, concernant des antibiotiques appartenant a 
des classes variees ainsi que d'autres metabolites secondaries (pour une revue, Chater K. 
15 1990), ont a ce jour deja ete etudiees chez les Streptomycetes. Cependant, la 
connaissance des voies de biosynthese des spiramycines n f est que tres partielle a ce jour. 

La biosynthese des spiramycines est un processus complexe comportant de 
nombreuses etapes et impliquant de nombreuses enzymes (Omura et aL, 1979a, Omura 
et aL, 1979b). Les spiramycines appartiennent a la large classe des polyketides qui 

20 regroupe des molecules complexes particulierement abondantes dans les 
microorganismes du sol. Ces molecules sont regroupees non pas par analogie de 
structure mais par une certaine similarite au niveau d'etapes de leur voie de biosynthese. 
En effet, les polyketides sont produits par une serie complexe de reactions mais 
possedent en commun d'avoir dans leur voie de biosynthese une serie de reactions 

25 catalysees par une ou des enzymes appelees « polyketides synthases » (PKS). Chez 
Streptomyces ambofaciens, la biosynthese du macro-cycle lactonique des spiramycines 
(platenolide) est realisee par une serie de huit modules codes par cinq genes PKS 
differents (Kuhstoss S., 1996, brevet US 5,945,320). Les spiramycines sont obtenues a 
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partir de ce cycle lactone. Cependant, les diverses etapes et enzymes impliquees dans la 
synthese des sucres, ainsi que leur liaison au cycle lactone et la modification de ce cycle 
pour l'obtention des spiramycines restent encore inconnues a ce jour. 

Le brevet US 5,514,544 decrit le clonage d'une sequence appelee srmR chez 
5 Streptomyces ambofaciens. II est fait l'hypothese dans ce brevet que le gene srmR code 
une proteine regulatrice de la transcription des genes impliques dans la biosynthese des 
macrolides. 

En 1987, Richardson et collaborateurs (Richardson et al., 1987) ont montre que la 
resistance a la spiramycine de S. ambofaciens est conferee par au moins trois genes, ces 

10 derniers ont ete appeles srmA, srmB et srmC. Le brevet US 4,886,757 decrit plus 
particulierement la caracterisation d'un fragment d'ADN de S. ambofaciens contenant le 
gene srmC. Cependant la sequence de ce gene n'a pas ete divulguee. En 1990, 
Richardson et collaborateurs (Richardson et al, 1990) ont pose l'hypothese de 
l'existence de trois genes de biosynthese de la spiramycine proche de srmB. Le brevet 

15 US 5,098,837 rapporte le clonage de cinq genes potentiellement impliques dans la 
biosynthese de la spiramycine. Ces genes ont ete baptises srmD, srmE, srmF, srmG et 
srmH. 

Une des difficulties majeures dans la production de composes tels que les 
spiramycines reside dans le fait que de tres grands volumes de fermentation sont 
20 necessaires a la production d'une quantite relativement faible de produit. II est done 
souhaitable de pouvoir augmenter 1'efficacite de production de telles molecules afin d'en 
diminuer les couts de production. 

La voie de biosynthese des spiramycines est un processus complexe et il serait 
souhaitable d'identifier et de supprimer les reactions parasites qui pourraient exister au 
25 cours de ce processus. Le but d'une telle manipulation est d'obtenir un antibiotique plus 
pur et/ou une amelioration de la productivity A ce sujet, Streptomyces ambofaciens 
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(Liu et ai, 1999). II serait done souhaitable de pouvoir disposer de souches ne 
produisant que de la spiramycins I. 

En raison de l'interet commercial des antibiotiques macrolides, l'obtention de 
nouveaux derives, notamment d'analogues de spiramycines ayant des proprietes 
5 avantageuses est intensivement recherchee. II serait souhaitable de pouvoir generer en 
quantite suffisante les intermediaries de biosynthese de la voie de biosynthese des 
spiramycines ou des derives des spiramycines notamment dans le but de fabriquer des 
antibiotiques hybrides derives des spiramycines. 

10 Description generate de rinvention 

La presente invention resulte du clonage de genes dont le produit intervient dans la 
biosynthese des spiramycines. L'invention concerne tout d'abord de nouveaux genes de 
la voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans 
cette biosynthese. 

15 Les genes de la voie de biosynthese et les sequences codantes associees ont ete 

clones et la sequence d'ADN de chacun a ete determinee. Les sequences codantes 
donees seront designees par la suite orfl *c, or/2*c, or/3*c, orf4*c, or/5*, orf6*, or/7*c, 
orf8*, or/9* orflO* orfl, orfl, or/3, or/4, orfi, orf6 y orp, orf8, orf9c, orflQ, orfllc, 
orfll, orfl 3c, orfl 4, orfl 5c, orfl 6, orfl 7, or/18, orfl 9, orf20, orfllc, orf22c, orf23c, 

20 orf24c, orf25c, orf26, orf27, orf28c, orf29, orftOc, or/31, orf32c, or/33 et orf34c. La 
fonction des proteines codees par ces sequences dans la voie de biosynthese des 
spiramycines est developpee dans la discussion ci-apres qui est illustree par les figures 4, 
5, 6 et 8. 

1) Un premier objet de rinvention concerne un polynucleotide codant un 
25 polypeptide implique dans la biosynthese des spiramycines caracterise en ce que la 
sequence dudit polynucleotide est : 
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(a) l'une des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 
30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 
109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, 

(b) Tune des sequences constitutes par les variants des sequences (a), 

5 (c) Tune des sequences derivees des sequences (a) et (b) en raison de la 

degenerescence du code genetique. 

2) La presente invention a egalement pour objet un polynucleotide s'hybridant 
dans des conditions d'hybridation de forte stringence a au moins Tun des 
polynucleotides selon le paragraphe 1) ci-dessus. 

10 3) L'invention concerne egalement un polynucleotide presentant au moins 70%, 

80%, 85%>, 90%o, 95% ou 98%) d'identite en nucleotides avec un polynucleotide 
comprenant au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 
250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 
1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 

15 1800, 1850 ou 1900 nucleotides consecutifs d'un polynucleotide selon le paragraphe 1) 
ci dessus. 

4) L'invention concerne egalement un polynucleotide selon le pragraphe 2) ou 3) 
ci-dessus caracterise en ce qu'il est isole a partir d'une bacterie du genre Streptomyces. 

5) L'invention concerne egalement un polynucleotide selon le pragraphe 2), 3) ou 
20 4) ci-dessus caracterise en ce qu'il code une proteine impliquee dans la biosynthese 

d'un macrolide. 

6) L'invention concerne egalement un polynucleotide selon le pragraphe 2), 3) ou 
4) ci-dessus caracterise en ce qu'il code une proteine ayant une activite similaire a la 
proteine codee par le polynucleotide avec lequel il s'hybride ou il presente l'identite. 

25 7) L'invention concerne egalement un polypeptide resultant de Texpression d f un 

polynucleotide selon le pragraphe 1), 2), 3), 4), 5) ou 6) ci-dessus. 
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8) Un autre aspect de F invention concerne un polypeptide implique dans la 
biosynthese des spiramycines caracterisee en ce que la sequence dudit polypeptide est : 

(a) Fune des sequences SEQ ED N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 
29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 

5 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 
142, 144, 146, 148 et 150, 

(b) Fune des sequences telles que definies en (a) excepte que tout au long de 
ladite sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes sans 
en affecter les proprietes fonctionnelles, 

10 (c) Fune des sequences constitutes par les variants des sequences (a) et (b). 

9) Un autre objet de Finvention concerne un polypeptide presentant au moins 
70%, 80%, 85%, 90%, 95% ou 98% d'identite en acides amines avec un polypeptide 
comprenant au moins 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 
200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 

15 540, 560, 580, 600, 620 ou 640 acides amines consecutifs d'un polypeptide selon le 
paragraphe 8) ci-dessus. 

10) Un autre aspect de Finvention concerne un polypeptide selon le paragraphe 9) 
ci-dessus caracterise en ce qu'il est isole a partir d'une bacterie du genre Streptomyces. 

1 1) Un autre aspect de Finvention concerne un polypeptide selon le paragraphe 9) 
20 ou 10) ci-dessus caracterise en ce qu'il code une proteine impliquee dans la biosynthese 

d'un macrolide. 

12) Un autre aspect de Finvention concerne un polypeptide selon le pragraphe 9), 
10) ou 11) ci-dessus caracterise en ce qu'il a une activite similaire a celle du 
polypeptide avec lequel il partage Fidentite. 

25 13) Un autre aspect de Finvention concerne un ADN recombinant caracterise en 

ce qu'il comprend au moins un polynucleotide selon Fun des paragraphes 1), 2), 3), 4), 
5) ou 6) ci-dessus. 
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14) Un autre aspect de 1' invention concerne un ADN recombinant selon le 
pragraphe 13) ci-dessus caracterise en ce que le dit ADN recombinant est compris dans 
un vecteur. 

15) Un autre aspect de 1' invention concerne un ADN recombinant selon le 
5 paragraphe 14) ci-dessus caracterise en ce que ledit vecteur est choisi parmi les 

bacteriophages, les plasmides, les phagemides, les vecteurs integratifs, les fosmides, les 
cosmides, les vecteurs navettes, les BAC ou les PAC. 

16) Un autre aspect de l'invention concerne un ADN recombinant selon le 
pragraphe 15) ci-dessus caracterise en ce qu'il est choisi parmi pOS49.1, pOS49.ll, 

10 pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5, 
pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, 
pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, 
pSPM507, pSPM508, pSPM509, pSPMl, pBXLllll, pBXL1112, pBXL1113, 
pSPM520, pSPM521, pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, 

15 pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, 
pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, pSPM47, pSPM48, pSPMSO, 
pSPM51, pSPM52, pSPM53, pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, 
pSPM515, pSPM519, pSPM74, pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 et 
pSPM106. 

20 17) Un autre aspect de l'invention concerne un vecteur d'expression caracterise en 

ce qu'il comprend au moins une sequence d'acide nucleique codant un polypeptide 
selon le pragraphe 7), 8), 9), 10), 1 1) ou 12) ci-dessus. 

18) L'invention est egalement relative a un systeme d'expression comprenant un 
vecteur d'expression approprie et une cellule hote permettant l'expression d'un ou 
25 plusieurs polypeptides selon le paragraphe 7), 8), 9), 10), 1 1) ou 12) ci-dessus. 



19) L'invention est egalement relative a un systeme d'expression selon le 
paragraphe 18 ci-dessus caracterise en ce qu'il est choisi parmi les systemes 
d'expression procaryotes ou les systemes d'expression eucaryotes. 
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20) L'invention est egalement relative a un systeme d'expression selon le 
paragraphe 19) ci-dessus caracterise en ce qu'il est choisi parmi les systemes 
d'expression chez la bacterie E. coli, les sytemes d'expression baculovirus permettant 
une expression dans des cellules d'insectes, les sytemes d'expression permettant une 

5 expression dans des cellules de levures, les sytemes d'expression permettant une 
expression dans des cellules de mammiferes. 

21) L'invention est egalement relative a une cellule hote dans laquelle a ete 
introduit au moins un polynucleotide et/ou au moins un ADN recombinant et/ou au 
moins un vecteur d'expression selon l'un des pragraphes 1), 2), 3), 4), 5), 6), 13), 14), 

10 15), 16) ou 17) ci-dessus. 

22) L'invention est egalement relative a un procede de production d'un 
polypeptide selon le paragraphe 7), 8), 9), 10), 11) ou 12) ci-dessus caracterise en ce 
que ledit procede comprend les etapes suivantes: 

a) inserer au moins un acide nucleique codant ledit polypeptide dans un vecteur 
15 approprie; 

b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 
transformee ou transfectee avec le vecteur de l'etape a) ; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
20 l'extrait cellulaire obtenu a l'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

23) Un autre aspect de l'invention concerne un microorganisme bloque dans une 
etape de la voie de biosynthese d'au moins un macrolide. 

24) Un autre aspect de l'invention concerne un microorganisme selon le 
25 paragraphe 23) ci-dessus caracterise en ce qu'il est obtenu en inactivant la fonction d'au 

moins une proteine impliquee dans la biosynthese de ce ou de ces macrolides dans un 
microorganisme producteur de ce ou de ces macrolide. 
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25) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 24) ci-dessus caracterise en ce que rinactivation de cette ou de ces proteines 
est effectuee par mutagenese dans le ou les genes codant ladite ou lesdites proteines ou 
par expression d'un ou de plusieurs ARN anti-sens complementaires de l'ARN ou des 

5 ARN messagers codant ladite ou lesdites proteines. 

26) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 25) ci-dessus caracterise en ce que l'inactivation de cette ou de ces proteines 
est effectuee par mutagenese par irradiation, par action d'agent chimique mutagene, par 
mutagenese dirigee ou par remplacement de gene. 

10 27) Un autre aspect de l'invention concerne un microorganisme selon le 

paragraphe 25) ou 26) ci-dessus caracterise en ce que la ou les mutageneses sont 
effectuees in vitro ou in situ, par suppression, substitution, deletion et/ou addition d'une 
ou plusieurs bases dans le ou les genes consideres ou par inactivation genique. 

28) Un autre aspect de l'invention concerne un microorganisme selon le 
15 paragraphe 23), 24), 25), 26) ou 27) ci-dessus caracterise en ce que ledit 

microorganisme est une bacterie du genre Streptomyces. 

29) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 23), 24), 25), 26), 27) ou 28) ci-dessus caracterise en ce que le macrolide est 
la spiramycine. 

20 30) Un autre aspect de l'invention concerne un microorganisme selon le 

paragraphe 23), 24), 25), 26), 27), 28) ou 29) ci-dessus caracterise en ce que ledit 
microorganisme est une souche de S. ambofaciens. 

31) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 23), 24), 25), 26), 27), 28), 29) ou 30) ci-dessus caracterise en ce que la 
25 mutagenese est effectuee dans au moins un gene comprenant une sequence selon l'un 
des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus. 
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32) Un autre aspect de Tinvention concerne un microorganisme selon le 
paragraphe 25), 26), 27), 28), 29), 30) ou 31) ci-dessus caracterise en ce que la 
mutagenese est effectuee dans un ou plusieurs genes comprenant une des sequences 
correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 1 1, 13, 15, 17, 19, 

5 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 
80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149 ; 

33) Un autre aspect de T invention concerne un microorganisme selon le 
paragraphe 25), 26), 27), 28), 29), 30), 31) ou 32) ci-dessus caracterise en ce que la 
mutagenese consiste en 1'inactivation genique d'un gene comprenant une sequence 

10 correspondant a la sequence SEQ ID N° 13. 

34) Un autre aspect de T invention concerne une souche de Streptomyces 
ambofaciens caracterisee en ce qu'il s'agit d'une souche choisie parmi Tune des 
souches deposees aupres de la Collection Nationale de Cultures de Microorganismes 
(CNCM) le 10 juillet 2002 sous le numero d'enregistrement 1-2909, 1-2911, 1-2912, I- 

15 2913, 1-2914, 1-2915, 1-2916 ou 1-2917. 

35) Un autre aspect de l'invention concerne un procede de preparation d'un 
intermediaire de biosynthese de macrolide caracterise en ce qu'il comprend les etapes 
suivantes : 

a) cultiver, dans un milieu de culture approprie, un microorganisme selon Tun des 
20 paragraphes 23), 24), 25), 26), 27), 28), 29), 30), 31), 32), 33) ou 34) ci dessus, 

b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

c) separer et purifier a partir dudit milieu de culture ou encore a partir de l'extrait 
cellulaire obtenu a l'etape b), ledit intermediaire de biosynthese. 

36) Un autre aspect de l'invention concerne un procede de preparation d'une 
25 molecule derivee d'un macrolide caracterise en ce que Ton prepare un intermediaire de 

biosynthese selon le procede du paragraphe 35) ci-dessus et que Ton modifie 
l'intermediaire ainsi produit 
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37) Un autre aspect de l'invention concerne un procede de preparation selon le 
paragraphe 36) ci-dessus caracterise en ce que Ton modifie ledit intermediate par voie 
chimique, biochimique, enzymatique et/ou microbiologique. 

38) Un autre aspect de P invention concerne un procede de preparation selon le 
5 paragraphe 36) ou 37) ci-dessus caracterise en ce que Pon introduit dans ledit 

microorganisme un ou plusieurs genes codant des proteines susceptibles de modifier 
rintermediaire en s'en servant comme substrat. 

39) Un autre aspect de P invention concerne un procede de preparation selon le 
paragraphe 36), 37) ou 38) ci-dessus caracterise en ce que le macrolide est la 

10 spiramycine. 

40) Un autre aspect de l'invention concerne un procede de preparation selon le 
paragraphe 36), 37), 38) ou 39) ci-dessus caracterise en ce que le microorganisme utilise 
est une souche de S. ambofaciens. 

41) Un autre aspect de l'invention concerne un microorganisme produisant de la 
15 spiramycine I mais ne produisant pas de spiramycine II et EI 

42) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 41) ci-dessus caracterise en ce qu'il comprend Pensemble des genes 
necessaires a la biosynthese de la spiramycine I mais que le gene comprenant la 
sequence SEQ ID N° 13 ou Pun de ses variants ou Pune des sequences derivees de 

20 celles-ci en raison de la degenerescence du code genetique et codant un polypeptide de 
sequence SEQ ID N° 14 ou Pun de ses variants n'est pas exprime ou a ete rendu inactif. 

43) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 42) ci-dessus caracterise en ce que la dite inactivation est realisee par 
mutagenese dans le gene codant ladite proteine ou par Pexpression d'un ARN anti-sens 

25 complementaire de PARN messager codant ladite proteine. 



12 



44) Un autre aspect de P invention concerne un microorganisme selon le 
paragraphe 43) ci-dessus caracterise en ce que la dite mutagenese est effectuee dans le 
promoteur de ce gene, dans la sequence codante ou dans une sequence non codante de 
maniere a rendre inactive la proteine codee ou a en empecher son expression ou sa 

5 traduction. 

45) Un autre aspect de Pinvention concerne un microorganisme selon la 
revendication 43) ou 44) ci-dessus caracterise en ce que la mutagenese est effectuee par 
irradiation, par action d'agent chimique mutagene, par mutagenese dirigee ou par 
remplacement de gene. 

10 46) Un autre aspect de Pinvention concerne un microorganisme selon le 

paragraphe 43), 44) ou 45) ci-dessus caracterise en ce que la mutagenese est effectuee in 
vitro ou in situ, par suppression, substitution, deletion et/ou addition d f une ou plusieurs 
bases dans le gene considere ou par inactivation genique. 

47) Un autre aspect de Pinvention concerne un microorganisme selon le 
15 paragraphe 41) ou 42) ci-dessus caracterise en ce que ledit microorganisme est obtenu 

en exprimant les genes de la voie de biosynthese de la spiramycine sans que ceux-ci ne 
comprennent le gene comprenant la sequence correspondant a SEQ ID N° 13 ou Pun de 
ses variants ou Pune des sequences derivees de celles-ci en raison de la degenerescence 
du code genetique et codant un polypeptide de sequence SEQ ID N° 14 ou Pun de ses 
20 variants. 

48) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46) ou 47) ci-dessus caracterise en ce que ledit 
microorganisme est une bacterie du genre Streptomyces. 

49) Un autre aspect de Pinvention concerne un microorganisme selon le 
25 paragraphe 41), 42), 43), 44), 45), 46), 47) ou 48) ci-dessus caracterise en ce que ledit 

microorganisme est obtenu a partir d'une souche de depart produisant les spiramycines 
I, H et m. 
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50) Un autre aspect de Finvention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46), 47), 48) ou 49) ci-dessus caracterise en ce qu'il 
est obtenu par mutagenese dans un gene comprenant la sequence correspondant a SEQ 
ID N° 13 ou Tun de ses variants ou Tune des sequences derivees de celles-ci en raison 

5 de la degenerescence du code genetique et codant un polypeptide de sequence SEQ ID 
N° 14 ou l'un de ses variants ayant la meme fonction. 

51) Un autre aspect de F invention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46), 47), 48), 49) ou 50) ci-dessus caracterise en ce 
que ledit microorganisme est obtenu a partir d'une souche de S. ambofaciens produisant 

10 les spiramycines I, II et m, dans laquelle est effectuee une inactivation genique du gene 
comprenant la sequences correspondant a SEQ ID N° 13 ou Fune des sequences 
derivees de celle-ci en raison de la degenerescence du code genetique. 

52) Un autre aspect de Finvention concerne une souche de S. ambofaciens 
caracterisee en ce qu'il s'agit de la souche deposee aupres de la Collection Nationale de 

15 Cultures de Microorganismes (CNCM) le 10 juillet 2002 sous le numero 
d'enregistrement 1-2910. 

53) Un autre aspect de Finvention concerne un procede de production de 
spiramycine I, caracterise en ce qu'il comprend les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon Fun 
20 des paragraphes 41), 42), 43), 44), 45), 46), 47), 48), 49), 50), 51) ou 52) ci-dessus, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
F extrait cellulaire obtenu a Fetape b), la spiramycine I. 

54) Un autre aspect de Finvention concerne Futilisation d'un polynucleotide selon 
25 Fun des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus pour ameliorer la production en 

macrolides d'un microorganisme. 
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55) Un autre aspect de Tinvention concerne un microorganisme mutant 
producteur de macrolide caracterise en ce qu'il possede une modification genetique dans 
au moins un gene comprenant une sequence selon Tun des paragraphes 1), 2), 3), 4), 5) 
ou 6) ci-dessus et/ou qu'il surexprime au moins un gene comprenant une sequence selon 

5 Tun des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus. 

56) Un autre aspect de 1' invention concerne un microorganisme mutant selon le 
paragraphe 55) ci-dessus caracterise en ce que la modification genetique consiste en une 
suppression, une substitution, une deletion et/ou une addition d'une ou plusieurs bases 
dans le ou les genes consideres dans le but d'exprimer une ou des proteines ayant une 

10 activite superieure ou d'exprimer un niveau plus eleve de cette ou de ces proteines. 

57) Un autre aspect de l'invention concerne un microorganisme mutant selon le 
paragraphe 55) ci-dessus caracterise en ce que la surexpression du gene considere est 
obtenue en augmentant le nombre de copie de ce gene et/ou en pla?ant un promoteur 
plus actif que le promoteur sauvage. 

15 58) Un autre aspect de l'invention concerne un microorganisme mutant selon le 

paragraphe 55) ou 57) ci-dessus caracterise en ce que la surexpression du gene 
considere est obtenue en transformant un microorganisme producteur de macrolide par 
une construction d'ADN recombinant selon le paragraphe 13, 14 ou 17 ci-dessus, 
permettant la surexpression de ce gene. 

20 59) Un autre aspect de l'invention concerne un microorganisme mutant selon le 

paragraphe 55), 56), 57) ou 58) ci-dessus caracterise en ce que la modification 
genetique est effectuee dans un ou plusieurs genes comprenant une des sequences 
correspondant a une ou plusieurs des sequences SEQ ED N° 3, 5, 7, 9, 1 1, 13, 15, 17, 19, 
21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 

25 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, ou l'un de ses 
variants ou l'une des sequences derivees de celles-ci en raison de la degenerescence du 
code genetique. 
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60) Un autre aspect de F invention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58) ou 59) ci-dessus caracterise le microorganisme surexprime 
un ou plusieurs genes comprenant une des sequences correspondant a une ou plusieurs 
des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 

5 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111,113, 
115, 118, 120, 141, 143, 145, 147 et 149, ou Fun de ses variants ou Fune des sequences 
derivees de celles-ci en raison de la degenerescence du code genetique. 

61) Un autre aspect de F invention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58), 59) ou 60) ci-dessus caracterise en ce que ledit 

10 microorganisme est une bacteries du genre Streptomyces. 

62) Un autre aspect de F invention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58), 59), 60) ou 61) ci-dessus caracterise en ce que le 
macrolide est la spiramycine. 

63) Un autre aspect de F invention concerne un microorganisme mutant selon le 
15 paragraphe 55), 56), 57), 58), 59), 60), 61) ou 62) ci-dessus caracterise en ce que ledit 

microorganisme est une souches de S. ambofaciens. 

64) Un autre aspect de F invention concerne un procede de production de 
macrolides, caracterise en ce qu'il comprend les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon Fun 
20 des paragraphes 55), 56), 57), 58), 59), 60), 61), 62), 63) ou 64) ci-dessus, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Fextrait cellulaire obtenu a Fetape b), le ou lesdits macrolides produits. 

65) Un autre aspect de Finvention concerne Futilisation d'une sequence et/ou d'un 
25 ADN recombinant et/ou d'un vecteur selon Fun des paragraphes 1), 2), 3), 4), 5), 6), 7), 

8), 9), 10), 11), 12), 13), 14), 15), 16) ou 17) ci-dessus pour la preparation 
d f antibiotiques hybrides. 
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66) Un autre aspect de l'invention concerne l'utilisation d'au moins un 
polynucleotide et/ou au moins un ADN recombinant et/ou au moins un vecteur 
d f expression et/ou au moins un polypeptide et/ou au moins une cellule hote selon Tun 
des paragraphes 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16), 17) ou 

5 21) ci-dessus pour realiser une ou plusieurs bioconversions. 

67) Un autre aspect de l'invention concerne un polynucleotide caracterise en ce 
qu'il s'agit d'un polynucleotide complementaire de Tun des polynucleotides selon le 
paragraphe 1), 2), 3), 4), 5), ou 6) ci-dessus. 

68) Un autre aspect de l'invention concerne un microorganisme producteur 
10 d'au moins une spiramycine caracterise en ce qu'il surexprime : 

- un gene susceptible d'etre obtenu par amplification en chame par 
polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 

15 matrice le cosmide pSPM36 ou FADN total de Streptomyces ambofaciens, 

- ou un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 

69) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 68 ou 90 caracterise en ce qu'il s'agit d'une bacterie du genre 

20 Streptomyces. 

70) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 68, 69 ou 90 caracterise en ce qu'il s'agit d'une bacterie de l'espece 
Streptomyces ambofaciens. 

71) Un autre aspect de l'invention concerne un microorganisme selon le 
25 paragraphe 68, 69, 70 ou 90 caracterise en ce que la surexpression dudit gene est 

obtenue par transformation dudit microorganisme par un vecteur d'expression. 
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72) Un autre aspect de l'invention concerne une souche de Streptomyces 
ambofaciens caracterisee en ce qu'il s'agit de la souche OSC2/pSPM75(l) ou de la 
souche OSC2/pSPM75(2) deposee aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris 

5 Cedex 15, France, le 6 octobre 2003 sous le numero d'enregistrement 1-3101. 

73) Un autre aspect de l'invention concerne un ADN recombinant caracterise 
en ce qu'il comprend : 

- un polynucleotide susceptible d'etre obtenu par amplification en chaine par 
polymerase en utilisant le couple d'amorces de sequence suivante : 5' 

10 AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

- ou un fragment d'au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 
90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 

15 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 
1480, 1490 ou 1500 nucleotides consecutifs de ce polynucleotide. 

74) Un autre aspect de l'invention concerne un ADN recombinant selon le 
paragraphe 73 ou 91 caracterise en ce qu'il s'agit d'un vecteur. 

75) Un autre aspect de l'invention concerne un ADN recombinant selon le 
20 paragraphe 73, 74 ou 91 caracterise en ce qu'il s'agit d'un vecteur d'expression. 

76) Un autre aspect de l'invention concerne une cellule hote dans laquelle a 
ete introduit au moins un ADN recombinant selon 1'un des paragraphes 73, 74, 75 ou 
91. 

77) Un autre aspect de l'invention concerne un procede de production d'un 
25 polypeptide caracterise en ce que ledit procede comprend les etapes suivantes: 

a) transformer une cellule hote par au moins un vecteur d'expression selon le 
paragraphe 75; 
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b) cultiver, dans un milieu de culture approprie, ladite cellule hote; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a l'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

78) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 51 caracterise en ce que l'inactivation genique est effectuee par deletion 
en phase du gene ou d'une partie du gene comprenant la sequence correspondant a 
SEQ ID N° 13 ou l'une des sequences derivees de celle-ci en raison de la 
degenerescence du code genetique. 

79) Un autre aspect de l'invention concerne un microorganisme selon Tun 
des paragraphes 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 ou 78 caracterise en ce en 
ce qu'il surexprime en outre : 

- un gene susceptible d'etre obtenu par amplification en chaine par polymerase en 
utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ED N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

- ou un gene derive de ceux-ci en raison de la degenerescence du code genetique. 

80) Un autre aspect de l'invention concerne un vecteur d'expression 
caracterise en ce que le polynucleotide de sequence SEQ ID N° 47 ou un 
polynucleotide derive de celui-ci en raison de la degenerescence du code genetique 
est place sous le controle d'un promoteur permettant l'expression de la proteine 
codee par le dit polynucleotide chez Streptomyces ambofaciens. 

81) Un autre aspect de Tinvention concerne un vecteur d'expression selon le 
paragraphe 80 caracterise en ce qu'il s'agit du plasmide pSPM524 ou pSPM525. 
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82) Un autre aspect de l'invention concerne une souche de Streptomyces 
ambofaciens transformee par un vecteur selon le paragraphe 80 ou 81 . 

83) Un autre aspect de Finvention concerne un microorganisme selon Tun des 
paragraphes 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 78, 79 ou 92 caracterise en ce 

5 qu'il surexprime en outre le gene de sequence codante SEQ ID N° 47 ou d'une 
sequence codante derivee de celle-ci en raison de la degenerescence du code 
genetique. 

84) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 83 caracterise en ce qu'il s'agit de la souche SPM502 pSPM525 deposee 

10 aupres de la Collection Nationale de Cultures de Microorganismes (CNCM) Institut 
Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 15, France, le 26 fevrier 2003 
sous le numero d'enregistrement 1-2977. 

85) Un autre aspect de l'invention concerne un procede de production de 
spiramycine(s), caracterise en ce qu'il comprend les etapes suivantes : 
15 (a) cultiver, dans un milieu de culture approprie, un microorganisme selon l'un 

des paragraphes 68, 69, 70, 71, 72, 78, 79, 82, 83, 84, 90 ou 92, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a l'etape b), les spiramycines. 

20 86) Un autre aspect de l'invention concerne un polypeptide caracterise en ce que 

sa sequence comprend la sequence SEQ ED N° 1 12 ou la sequence SEQ ID N° 142. 

87) Un autre aspect de l'invention concerne un polypeptide caracterise en ce 
que sa sequence correspond a la sequence traduite de la sequence codante : 

- d'un gene susceptible d'etre obtenu par amplification en chaine par 
25 polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
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GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

- ou d'un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 

5 88) Un autre aspect de l'invention concerne un vecteur d'expression permettant 

l'expression d'un polypeptide selon le paragraphe 86, 87 ou 93 chez Streptomyces 
ambofaciens. 

89) Un autre aspect de l'invention concerne un vecteur d'expression selon le 
paragraphe 88 caracterise en ce qu'il s'agit du plasmide pSPM75. 

10 90) Un autre aspect de l'invention concerne un microorganisme selon le 

paragraphe 68 caracterise en ce que le gene susceptible d'etre obtenu par 
amplification en chaine par polymerase est le gene de sequence codante SEQ ID N° 
141 ou un gene derive de celui-ci en raison de la degenerescence du code genetique. 

91) Un autre aspect de l'invention concerne un ADN recombinant selon le 
15 paragraphe 73 caracterise en ce que le polynucleotide susceptible d'etre obtenu par 

amplification en chaine par polymerase est un polynucleotide de sequence SEQ ID 
N° 141. 

92) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 79 caracterise en ce que le gene susceptible d'etre obtenu par 

20 amplification en chaine par polymerase est le gene de sequence codante SEQ ID N° 
141 ou un gene derive de celui-ci en raison de la degenerescence du code genetique. 

93) Un autre aspect de l'invention concerne un polypeptide caracterise en ce 
que sa sequence est SEQ ID N° 142. 
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Definitions generates 

Le terme " isole " au sens de la presente invention designe un materiel biologique 
(acide nucleique ou proteine) qui a ete soustrait a son environnement originel 
5 (V environnement dans lequel il est localise naturellement). 

Par exemple un polynucleotide present a l'etat naturel dans une plante ou un 
animal n'est pas isole. Le meme polynucleotide separe des acides nucleiques adjacents 
au sein desquels il est naturellement insere dans le genome de la plante ou l'animal est 
considere comme " isole ". 

10 Un tel polynucleotide peut etre inclus dans un vecteur et/ou un tel polynucleotide 

peut etre inclus dans une composition et demeurer neanmoins a l'etat isole du fait que le 
vecteur ou la composition ne constitue pas son environnement naturel. 

Le terme " purifie " ne necessite pas que le materiel soit present sous une forme de 
purete absolue, exclusive de la presence d'autres composes. D s'agit plutot d'une 
1 5 definition relative. 

Un polynucleotide est a l'etat " purifie " apres purification du materiel de depart 
ou du materiel naturel d'au moins un ordre de grandeur, de preference 2 ou 3 et 
preferentiellement 4 ou 5 ordres de grandeur. 

Aux fins de la presente invention le terme ORF (« Open Reading Frame », c'est a 
20 dire cadre ouvert de lecture) a ete employe pour designer en particulier la sequence 
codante d'un gene. 

Aux fins de la presente description, Texpression " sequence nucleotidique " peut 
etre employee pour designer indifferemment un polynucleotide ou un acide nucleique. 
L'expression " sequence nucleotidique " englobe le materiel genetique lui-meme et n'est 
25 done pas restreinte a l'information concernant sa sequence. 
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Les termes " acide nucleique ", " polynucleotide " oligonucleotide " ou encore " 
sequence nucleotidique " englobent des sequences d'ARN, d'ADN, d'ADNc ou encore 
des sequences hybrides ARN/ADN de plus d'un nucleotide, indifferemment sous la 
forme simple chaine ou sous la forme de duplex. 

5 Le terme " nucleotide " designe a la fois les nucleotides naturels (A, T, G, C) ainsi 

que des nucleotides modifies qui comprennent au moins une modification telle que (1) 
un analogue d'une purine, (2) un analogue d'une pyrimidine, ou (3) un sucre analogue, 
des exemples de tels nucleotides modifies etant decrits par exemple dans la demande 
PCTN°WO 95/04 064. 

10 Aux fins de la presente invention, un premier polynucleotide est considere comme 

etant " complementaire " d'un second polynucleotide lorsque chaque base du premier 
polynucleotide est appariee a la base complementaire du second polynucleotide dont 
l'orientation est inversee. Les bases complementaires sont A et T (ou A et U), ou C et G. 

Le terme « genes de la voie de biosynthese des spiramycines » comprend 
15 egalement les genes regulateurs et les genes conferant la resistance aux microorganismes 
producteurs. 

On entendra par " fragment " d'un acide nucleique de reference selon l'invention, 
une sequence nucleotidique de longueur reduite par rapport a 1 'acide nucleique de 
reference et comprenant, sur la partie commune, une sequence en nucleotides identique a 
20 l'acide nucleique de reference. 

Un tel " fragment " d'acide nucleique selon l'invention peut etre le cas echeant, 
compris dans un polynucleotide plus grand duquel il est constitutif. 

De tels fragments comprennent ou alternativement consistent en, des 
polynucleotides de longueur allant de 8, 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 
25 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 
950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 
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1650, 1700, 1750, 1800, 1850 ou 1900 nucleotides consecutifs d'un acide nucleique 
selon 1' invention. 

Par " fragment " d'un polypeptide selon l'invention, on entendra un polypeptide 
dont la sequence d'acides amines est plus courte que celle du polypeptide de reference et 
5 qui comprend sur toute la partie commune avec ces polypeptides de reference, une 
sequence en acides amines identique. 

De tels fragments peuvent, le cas echeant, etre compris au sein d'un polypeptide 
plus grand duquel ils font partie. 

De tels fragments d'un polypeptide selon l'invention peuvent avoir une longueur 
10 de 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240, 260, 
280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 
ou 640 acides amines. 

Par " conditions d'hybridation de forte stringence " au sens de la presente 
invention, on entendra des conditions d'hybridation defavorisant rhybridation de brins 

15 d'acides nucleiques non homologues. Des conditions d'hybridations de forte stringence 
peuvent etre par exemple decrites comme des conditions d'hybridation dans le tampon 
decrit par Church & Gilbert (Church & Gilbert, 1984) a une temperature comprise entre 
55°C et 65°C, de maniere preferee la temperature d'hyridation est de 55°C, de maniere 
encore plus preferee la temperatue d'hybridation est de 60°C et de maniere tout a fait 

20 preferee la temperature d'hybridation est de 65°C, suivi d'un ou plusieurs lavages 
effectue en tampon 2X SSC (le tampon IX SSC correspond a une solution aqueuse 
0,1 5M NaCl, 15 mM de citrate de sodium) a une temperature comprise entre 55°C et 
65°C, de maniere preferee cette temperature est de 55°C, de maniere encore plus 
preferee cette temperatue est de 60°C et de maniere tout a fait preferee cette temperature 

25 est de 65°C, suivi d'un ou plusieurs lavages en tampon 0.5X SSC a une temperature 
comprise entre 55°C et 65°C, de maniere preferee cette temperature est de 55°C, de 
maniere encore plus preferee cette temperatue est de 60°C et de maniere tout a fait 
preferee cette temperature est de 65°C. 
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II va sans dire que les conditions d'hybridation ci-dessus decrites peuvent etre 
adaptees en fonction de la longueur de l'acide nucleique dont l'hybridation est 
recherchee ou du type de marquage choisi, selon des techniques connues de l'homme du 
metier. Les conditions convenables d'hybridation peuvent par exemple etre adaptees 
5 selon l'ouvrage de F. Ausubel et al (2002). 

Par " variant " d'un acide nucleique selon l'invention, on entendra un acide 
nucleique qui differe d'une ou plusieurs bases par rapport au polynucleotide de 
reference. Un acide nucleique variant peut etre d'origine naturelle, tel qu'un variant 
allelique retrouve naturellement, ou peut etre aussi un variant non naturel obtenu par 
1 0 exemple par des techniques de mutagenese. 

En general, les differences entre l'acide nucleique de reference et l'acide nucleique 
variant sont reduites de telle sorte que les sequences nucleotidiques de Tacide nucleique 
de reference et de l'acide nucleique variant sont tres proches et, dans de nombreuses 
regions, identiques. Les modifications de nucleotides presentes dans un acide nucleique 
15 variant peuvent etre silencieuses, ce qui signifie qu'elles n'alterent pas les sequences 
d'aminoacides codees par ledit acide nucleique variant. 

Cependant, les changements de nucleotides dans un acide nucleique variant 
peuvent aussi resulter de substitutions, additions, deletions dans le polypeptide code par 
l'acide nucleique variant par rapport aux peptides codes par l'acide nucleique de 
20 reference. En outre, des modifications de nucleotides dans les regions codantes peuvent 
produire des substitutions, conservatives ou non conservatives dans la sequence 
d'aminoacides. 

De preference, les acides nucleiques variants selon l'invention codent des 
polypeptides qui conservent sensiblement la meme fonction ou activite biologique que le 
25 polypeptide de l'acide nucleique de reference ou encore la capacite a etre reconnus par 
des anticorps diriges contre les polypeptides codes par l'acide nucleique initial. 
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Certains acides nucleiques variants coderont ainsi des formes mutees des 
polypeptides dont P etude systematique permettra de deduire des relations structure 
activite des proteines en question. 

Par " variant " d'un polypeptide selon l'invention, on entendra principalement un 
5 polypeptide dont la sequence d'acides amines contient une ou plusieurs substitutions, 
additions ou deletions d'au moins un residu d'acide amine, par rapport a la sequence 
d'acides amines du polypeptide de reference, etant entendu que les substitutions 
d'aminoacides peuvent etre indifferemment conservatives ou non conservatives. 

De preference, les polypeptides variants selon l'invention conservent sensiblement 
10 la meme fonction ou activite biologique que le polypeptide de reference ou encore la 
capacite a etre reconnus par des anticorps diriges contre les polypeptides initiaux. 

Par polypeptide ayant " une activite similaire " a un polypeptide de reference au 
sens de l'invention, on entend un polypeptide ayant une activite biologique proche, mais 
pas necessairement identique, de celle du polypeptide de reference tel que mesure dans 
15 un essai biologique convenable a la mesure de l'activite biologique du polypeptide de 
reference. 

Par " antibiotique hybride " au sens de T invention on entend un compose, genere 
par la construction d'une voie de biosynthese artificielle utilisant la technologie de 
TADN recombinant. 

20 
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Description detaillee de lMnvention 

La presente invention a plus particulierement pour objet, de nouveaux genes de la 
voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans cette 
biosynthese tels que presentes dans la description detaillee ci-dessous. 

5 Les genes de la voie de biosynthese ont ete clones et la sequence d'ADN de ces 

genes a ete determines Les sequences obtenues ont ete analysees grace au programme 
FramePlot (Ishikawa J & Hotta K. 1999). On a identifie, parmi les phases ouvertes de 
lecture, les phases ouvertes de lecture presentant un usage des codons typiques de 
Streptomyces. Cette analyse a montre que cette region comporte 44 ORFs, localisees de 

10 part et d'autre de cinq genes codant l'enzyme «polyketide synthase » (PKS), et 
presentant un usage des codons typique de Streptomyces, De part et d'autre de ces cinq 
genes codant la PKS, respectivement 10 et 34 ORFs ont ete identifiees en aval et en 
amont (l'aval et l'amont etant definis par l'orientation des 5 genes de PKS tous orientes 
dans le meme sens) (cf. figure 3 et 37). Ainsi, les 34 phases ouvertes de lecture de ce 

15 type, occupant une region d'environ 41,7 kb (cf. SEQ ED N° 1 presentant une premiere 
region de 31 kb contenant 25 ORFs et SEQ ID N° 140 presentant une region d'environ 
12,1 kb dont 1,4 kb chevauchent la sequence precedente (SEQ ID N° 1) et environ 10,7 
kb correspondent a la suite de la sequence, cette derniere partie d'environ 10,7 kb 
contenant 9 ORFs supplementaires (dont un ORF de sequence partielle), cf. egalement 

20 figure 3 et 37 et ci-dessous), ont ete identifiees en amont des 5 genes codant la PKS et 
10 occupant une region d'environ 11,1 kb (SEQ ID N° 2 et figure 3), ont ete identifiees 
en aval des genes de la PKS. Les 10 genes situes en aval des 5 genes PKS ont ainsi ete 
nommes orfl*c, orf2*c, orf3*c, orff*c f orfi*, orf6* orf7*c, or/8* or/9*, orflO* (SEQ 
ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21). Le « c » ajoute dans le nom du gene signifiant 

25 pour l'ORF en question que la sequence codante est dans 1'orientation inverse (le brin 
codant est done le brin complementaire de la sequence donnee en SEQ ID N° 2 pour ces 
genes). En utilisant la meme nomenclature, les 34 ORFs en amont des genes de la PKS 
ont ete nommes orfl, orfl, orf3, orf4, orfi, orf6 y orf7 f orfiS, orf9c, orflO, orfllc, orfl2 f 
orfl3c, Off 14, orfl 5c, orfl 6, orfl 7, orfl 8, or/19, orf20, orfilc, orf22c, orf23c, orf24c, 
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orf25c, orf26, orf27, orf28c, orf29, orfiOc, or/31, orf32c, or/33 et or/34c (SEQ ID N° 
23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 
82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149) (cf. figure 3 et 37). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
5 comparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et aL, 1990) (Altschul et al. 9 1997), CD-search, COGs 
(Cluster of Orthologous Groups) (ces trois programmes sont accessibles notamment 
aupres du National Center for Biotechnology Information (NCBI) (Bethesda, Maryland, 
USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), 
10 BEAUTY (Worley K. C. et al. 9 1995)), (ces deux programmes sont accessibles 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese des 
spiramycines. 

15 Genes situes en aval des genes codant les PKS 

Une representation schematique de Forganisation de la region est presentee en 
figure 3. Ainsi qu'il sera demontre ci-dessous, sur les 10 genes identifies en aval des 
genes codant les PKS 9 semblent impliques dans la biosynthese ou la resistance aux 
spiramycines. II s'agit des 9 genes suivants : orfl*c, or/2*c, orf3*c, orf4*c, orf5*, orf6*, 
20 orf7*c, or/8*etorf9* 

Dans le tableau 1 suivant sont presentees les references a la sequence en ADN et 
en acides amines des 10 genes identifies en aval des 5 genes PKS. 



Tableau 1 



Gene 


Position dans la 
sequence SEQ ID N 2 


Sequence ADN 


Sequences polypeptidiques 


orfl*c 


10882 a 10172 


SEQ ID N 3 


SEQ ID N 4 


orf2*c 


10052 a 8781 


SEQ ID N 5 


SEQ ID N 6 
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orf3*c 


8741 a 7476 


SEQIDN 7 


SEQIDN 8 


orf4*c 


7459 a 6100 


SEQIDN 9 


SEQIDN 10 


orp* 


5302 a 5976 


SEQIDN 11 


SEQIDN 12 


orf6* 


4061 a 5305 


SEQIDN 13 


SEQIDN 14 


orf7*c 


3665 a 2817 


SEQIDN 15 


SEQIDN 16 


or/8* 


1925 a 2755 


SEQIDN 17 


SEQIDN 18 


or/9* 


1007 a 1888 


SEQIDN 19 


SEQIDN 20 


or/70* 


710 a 937 


SEQIDN 21 


SEQ ID N 22 



Le « c » ajoute dans le nom du gene indique que la sequence codante est dans 
l'orientation inverse (le brin codant est done le brin complementaire de la sequence 
donnee en SEQ ED N° 2 pour ces genes). 



Dans le but de determiner la fonction des polypeptides identifies, trois types 
5 d' experiences ont ete menes : la comparaison des sequences identifies avec des 
sequences de fonctions connues, des experiences d'inactivation de genes, conduisant a la 
construction de souches mutantes et des analyses de la production en spiramycines et en 
intermediaires de biosynthese des spiramycines par ces souches mutantes. 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont tout 
10 d'abord ete comparees avec celles presentes dans differentes bases de donnees grace a 
differents programmes: BLAST (Altschul et aL, 1990) (Altschul et al. 9 1997), CD- 
search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. J. 
Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C et aL, 1995)). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
15 genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycine. Le tableau 2 montre les proteines presentant une forte similitude avec les 
produits 10 genes situes en aval des 5 genes PKS. 
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Tableau 2 



Produit 
de gene 


Proteine presentant une 
similitude significative 


Numero d'acces 
uenBank 


Score 
r$LAi> 1 * 


Fonction rapportee 


orfl*c 


TylMI(orf3*) (S.fradiae) 


CAA57473 


287 


N- 

methyltransferase 


or/2*c 


dnrQ gene product 
(Streptomyces peucetius) 


AAD15266 


153 


Inconnue 


or/3*c 


TylMH(orf2*) {S.fradiae) 


CAA57472 


448 


Glycosyltransferas 
e 


orf4*c 


Crotonyl-CoA reductase 
(S. coelicolor) 


NP_630556 


772 


Crotonyl-CoA 
reductase 


orf5* 


MdmC (S. mycarofaciens) 


B42719 


355 


O- 

methyltransferase 


orf6* 


3-O-acyltransferase (S. 
mycarofaciens) 


Q00718 


494 


Acyltransferase 


orf7*c 


MdmA (S. 
mycarofaciens) 


A60725 


380 


Proteine impliquee 
dans la resistance 
a la midecamycine 


-TO sis 

or/8* 


ABC-transporteur (5. 


CAC22119 


191 


ABC-transporteur 


or/9* 


ABC-transporteur (S. 

griseus) 


CAC22118 


269 


ABC-transporteur 


orflO* 


Putative small conserved 
hypothetical protein (S. 
coelicolor) 


NP_627432 


109 


Inconnue 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al, 1990). 

Des experiences d'inactivation de genes ont ete realisees pour confirmer ces resultats. 
5 Les methodes utilisees consistent a effectuer un remplacement de gene. Le gene cible a 
interrompre est remplace par une copie de ce gene interrompue par une cassette 
conferant la resistance a un antibiotique (par exemple I'apramycine, la geneticine ou 
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l'hygromycine). Les cassettes utilisees sont bordees de part et d'autre par des codons de 
terminaison de la traduction dans toutes les phases de lecture et par des terminateurs de 
transcription actifs chez Streptomyces. L'insertion de la cassette dans le gene cible peut 
s'accompagner ou non d'une deletion dans ce gene cible. La taille des regions flanquant 
5 la cassette peut aller de quelques centaines a plusieurs milliers de paires de bases. Un 
deuxieme type de cassettes peut etre utilise pour 1'inactivation de genes : des cassettes 
dites « cassettes excisables ». Ces cassettes presentent l'avantage de pouvoir etre 
excisees chez Streptomyces par un evenement de recombinaison de site specifique apres 
avoir ete introduites dans le genome de 5. ambofaciens. Le but est d'inactiver certains 

10 genes dans des souches de Streptomyces sans laisser dans la souche finale de marqueurs 
de selection ou de grandes sequences d'ADN n'appartenant pas a la souche. Apres 
excision il subsiste uniquement une courte sequence d'une trentaine de paires de bases 
(appele site « cicatriciel ») dans le genome de la souche (cf. figure 10). La mise en 
oeuvre de ce systeme consiste, dans un premier temps, au remplacement de la copie 

15 sauvage du gene cible (grace a deux evenements de recombinaison homologue, cf. figure 
9) par une construction dans laquelle une cassette excisable a ete inseree dans ce gene 
cible. L'insertion de cette cassette est accompagnee d'une deletion dans le gene cible (cf. 
figure 9). Dans un deuxieme temps, l'excision de la cassette excisable du genome de la 
souche est provoquee. La cassette excisable fonctionne grace a un systeme de 

20 recombinaison site specifique et a pour avantage de permettre 1'obtention de mutants de 
Streptomyces ne portant finalement pas de gene de resistance. On s'affranchit egalement 
d'eventuels effets polaires sur l'expression des genes situes en aval du ou des genes 
inactives (cf. figure 10). Les souches ainsi construites ont ete testees pour leur 
production en spiramycines. 

25 L'inactivation des genes orfl *c f or/2*c, orf3*c et orf4*c n'a pas ete effectuee car 

les experiences de comparaison de sequence ont permis de determiner que ces genes 
avaient une similitude relativement importante avec des genes impliques dans la 
biosynthese d'un antibiotique relativement proche. Ainsi, le gene orfl*c code une 
proteine presentant une identite de 66% (determinee grace au programme BLAST) avec 

30 la proteine codee par gene tylMI qui code une N-methyltransferase impliquee dans la 
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biosynthese de tylosine et catalysant la 3 N-methylation durant la production du 
mycaminose chez Streptomyces fradiae (Gandecha,A.R. et al. 9 1997 ; Numero d'acces 
GenBank : CAA57473 ; Score BLAST : 287). Cette similitude avec une proteine 
impliquee dans la voie de biosynthese d'un autre antibiotique relativement proche et 
5 plus particulierement dans la biosynthese du mycaminose suggere que le gene orfl *c 
code une N-methyltransferase responsable d'une N-methylation lors de la biosynthese de 
la forosamine ou du mycaminose (cf. figure 5 et 6). Cette hypothese est etayee par le fait 
que la proteine codee par le gene orfl*c presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 3). 

10 Tableau 3 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


methyltransferase (S. antibioticus) 


CAA05643 


277 


methyltransferase 


N,N-dimethyltransferase (S. venezuelae) 


AAC68678 


268 


N,N- 

dimethyltransferase 


probable N-methylase snogX (S. 
nogalater) 


T46679 


243 


N-methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1990). 



Le gene or/2*c code une proteine presentant une relative forte similitude (35% 
d'identite) avec une proteine codee par le gene tylMIII codant une NDP hexose 3,4 
15 isomerase impliquee dans la biosynthese de la tylosine chez Streptomyces fradiae 
(Gandecha,A.R., et al, 1997 ; Numero d'acces GenBank : CAA57471 ; Score BMAST : 
130). Cette similitude avec une proteine impliquee dans la voie de biosynthese d'un 
autre antibiotique proche et plus particulierement dans la biosynthese du mycaminose 
suggere fortement que le gene orf*2c code une NDP hexose 3,4 isomerase responsable 
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d'isomerisation lors de la biosynthese d'un des sucres de la spiramycine, eventuellement 
le mycaminose (cf. figure 5 et 6). 

Le gene or/3*c code une proteine presentant une relative forte similitude (59% 
d'identite) avec une proteine codee par le gene tylMII codant une glycosyltransferase 

5 impliquee dans la biosynthese de la tylosine chez Streptomyces fradiae (Gandecha,A.R. 
et al y 1997; Numero d"acces GenBank: CAA57472 ; Score BLAST: 448). Cette 
similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique proche suggere fortement que le gene orf*3c code une glycosyltransferase. 
Cette hypothese est etayee par le fait que la proteine codee par le gene or/3*c presente 

10 une forte similitude avec d'autres proteines de fonction similaire chez d'autres 
organismes (cf. tableau 4). 



Tableau 4 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glycosyl transferase (S. venezuelae) 


AAC68677 


426 


Glycosyltransferase 


Glycosyltransferase (S. antibioticus) 


CAA05642 


425 


Glycosyltransferase 


Glycosyltransferase 
(Saccharopolyspora erythraea) 


CAA74710 


395 


Glycosyltransferase 


Glycosyltransferase (& antibioticus) 


CAA05641 


394 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1990). 



15 Le gene orf4*c code une proteine presentant une relative forte similitude avec 

plusieurs crotonyl-CoA reductases. Notamment, la proteine codee par orf4*c possede 
une similitude importante avec une crotonyl CoA reductase de chez Streptomyces 
coelicolor (Redenbach,M et al., 1996 ; Numero d'acces GenBank : NP 630556 ; Score 
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BLAST : 772). Cette similitude avec une proteine impliquee dans la voie de biosynthese 
d'un autre antibiotique proche suggere fortement que le gene orf4*c code egalement une 
crotonyl-CoA reductase. Cette hypothese est etayee par le fait que la proteine codee par 
le gene orf4*c presente une forte similitude avec d'autres proteines de fonction similaire 
5 chez d'autres organismes (cf. tableau 5). 



Tableau 5 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


trans-2-enoyl-CoA reductase 
(EC1.3.1.38) (5. collinus) 


S72400 


764 


trans-2-enoyl-CoA 
reductase 


Crotonyl CoA reductase (S.fradiae) 


CAA57474 


757 


Crotonyl CoA reductase 


Crotonyl-CoA reductase (5. 
cinnamonensis) 


AAD53915 


747 


Crotonyl-CoA reductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al., 1990). 



Le gene orf6* presente une certaine similitude avec le gene mdmB present chez 
10 Streptomyces mycarofaciens (Hara et Hutchisnson, 1992 ; numero d'acces GenBank : 
A42719 ; Score BLAST : 489) producteur d'antibiotique macrolide. Chez ce producteur, 
le gene est implique dans l'acylation du cycle lactone. Le gene orf6* coderait done une 
acyltransferase. Cette hypothese est etayee par le fait que la proteine codee par le gene 
orf6* presente une forte similitude avec d'autres proteines de fonction similaire chez 
15 d'autres organismes (cf. tableau 6). 
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Tableau 6 



Proteine presentant une 
similitude significative 


Numero 
d'acces 

vJ w 1 i-LJ ill 1A 


Score 
BLAST* 


Fonctionrapportee 


AcyA (Streptomyces 
thermotolerans) 


J4001 


450 


macrolide 3 -O-acyltransferase 


Midecamycine 4"-0- 
propionyl transferase (S. 
mycarofaciens) 


BAA09815 


234 


Midecamycine 4"-0-propionyl 
transferase 


Mycarose O-acyltransferase 
{Micromonospora 
megalomicea subsp. Nigra) 


AAG13909 


189 


Mycarose O-acyltransferase 



une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al., 1990). 

L'inactivation du gene orf6* a ete realisee par une deletion/insertion en phase et il 
5 a ete montre que la souche resultante ne produit plus de spiramycine II et HI mais 
uniquement de la spiramycine I (cf figure 1). Ceci confirme que le gene orf6* est bien 
implique dans la synthese de spiramycine II et in. L'enzyme codee par ce gene est 
responsable de la formation de spiramycine II et EI par fixation d'un groupement acetyl 
ou butyryl sur le carbone 3. Les souches n'exprimant plus la proteine codee par le gene 
10 orf6* sont particulierement interessantes puisqu'elles ne produisent plus de spiramycine 
II et HI mais seulement de la spiramycine I. Comme il a ete precise ci-dessus, l'activite 
antibiotique de la spiramycine I est nettement superieure a celle des spiramycines II et HI 
(Liu etal, 1999). 

Le gene orf5* code une proteine presentant une relative forte similitude avec 
15 plusieurs O-methyltransferase. Notamment, la proteine codee par or/5* possede une 
similitude importante avec une O-methyltransferase (EC 2.1.1.-) MdmC de 
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Streptomyces mycarofaciens (Hara & Hutchinson, 1992; Numero d'acces 
GenBank :B42719; Score BLAST : 355). Cette similitude avec une proteine impliquee 
dans la voie de biosynthese d'un autre antibiotique suggere fortement que le gene orf5* 
code egalement une O-methyltransferase. Le gene orf 5* serait implique dans la 

5 formation de precurseurs incorpores dans le cycle lactone. En effet, d'apres les 
comparaisons de sequences, le produit du gene orf5* est egalement relativement proche 
de FkbG qui est responsable de la methylation de l'hydroxymalonyl-ACP d'apres (Wu et 
al. 9 2000 ; Hoffmeister et al. 9 2000 ; Numero d'acces GenBank : AAF86386 ; Score 
BLAST : 247) (cf. figure 8). Cette hypothese est etayee par le fait que la proteine codee 

10 par le gene or/5* presente une forte similitude avec d'autres proteines de fonction 
similaire chez d'autres organismes (cf. tableau 7). 



Tableau 7 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Probable O-methyltransferase (EC 
2.1.1.-) safC (Myxococcus xanthus) 


T18553 


223 


O-methyltransferase 


4-O-methyltransferase (EC 2.1.1.-) - 
{Streptomyces sp.) 


JC4004 


222 


O-methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1990). 



15 Grace a l'effet polaire de l'insertion d'une cassette non excisee dans le gene orf 6*, 

il a pu etre determine que le gene orf 5* est essentiel a la voie de biosynthese des 
spiramycines. En effet, l'insertion de la cassette excisable dans la partie codante du gene 
orf 6* entraine un arret total de la production en spiramycines. Cependant, une fois que 
la cassette inseree a ete excisee (et done lorsque seul le gene orf 6* est inactive, cf 

20 exemples 14 et 15), on retrouve une production en spiramycine I. Ceci montre que le 
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gene orf 5* est essentiel a la voie de biosynthese des spiramycines puisque son 
inactivation entraine un arret total de la production en spiramycines. 

Le gene or/5* code une proteine presentant une relative forte similitude avec 
plusieurs O-methyltransferase. Le gene or/5* serait une O-methyl transferase impliquee 
5 soit directement dans la synthese du platenolide, soit dans la synthese d'un precurseur 
methyle (methoxymalonyl, voir figure 8) incorpore dans le platenolide par la PKS. Pour 
verifier cette hypothese, des experiences d'analyse CL/SM et de RMN ont ete conduites 
sur une souche de S. ambofaciens de genotype : orf6*::attlQhyg+. Dans cette souche le 
gene or/5* n'est pas exprime a cause de 1'effet polaire de l'insertion, dans le gene orf6*, 

10 de la cassette qui contient des terminateurs de transcription (cf. exemple 27). II a ete 
montre que cette souche produit une molecule dont le spectre UV a une allure similaire 
a celui de la spiramycine I mais le spectre de masse montre un ion moleculaire a 829. La 
difference de masse de 14 par rapport a la masse de la spiramycine peut s'expliquer par 
l'absence de methyl sur l'oxygene portee par le carbone n°4 du cycle lactone (la 

15 strucutre de ce compose est presente en figure 39). Les resultats obtenus par RMN sont 
compatibles avec cette hypothese. La presence d'un compose a 829 permet de valider 
l'hypothese du role de orf5* dans la biosynthese des spiramycines. En outre, le produit 
correspondant a la spiramycine sans le groupement methyle presente une tres faible 
activite microbologique (plus faible d'un facteur 10) par rapport a la spiramycine non 

20 modifiee, lorsque testee sur le microorganisme Micrococcus luteus. 

Le gene orf7*c code une proteine presentant une relative forte similitude avec une 
proteine codee par le gene mdmA de Streptomyces mycarofaciens, ce dernier codant une 
proteine impliquee dans la resistance a la midecamycine chez cet organisme producteur 
(Hara et ah, 1990 ; Numero d'acces GenBank : A60725 ; Score BLAST : 380). Cette 
25 similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique suggere fortement que le gene orf7*c code egalement une proteine 
impliquee dans la resistance a la spiramycine. Plus particulierement, l'enzyme codee par 
le gene orf7*c possede une activite methyltransferase et est impliquee dans la resistance 
a la spiramycine chez Streptomyces ambofaciens. II a ete demontre que ce gene confere 
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une resistance de type MLS I, resistance dont on sait qu'elle est due a la mono- 
methylation en position A2058 de 1'ARN ribosomal 23S (Pernodet et ah, 1996). Cette 
hypothese est etayee par le fait que la proteine codee par le gene or/7*c presente une 
forte similitude avec d'autres proteines de fonction similaire chez d'autres organismes 
5 (cf tableau 8). 



Tableau 8 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


macrolide-lincosamide-streptogramin B 
resistance determinant (S.fradiae) 


JC5319 


238 


23S rRNA 
methyltransferase 


23 S ribosomal RNA methyltransferase 
ErmML (Micrococcus luteus) 


AAL68827 


119 


23S rRNA 
methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et ah, 1990). 



Le gene or/8* code une proteine presentant une relative forte similitude avec une 
10 proteine de type transporteur ABC chez Streptomyces griseus (Campelo, 2002, Numero 
d'acces GenBank : CAC221 19 ; Score BLAST : 191). Cette similitude avec une proteine 
de type transporteur ABC suggere fortement que le gene or/8* code egalement une 
proteine de type transporteur ABC pouvant etre impliquee dans la resistance a la 
spiramycine. Cette hypothese est etayee par le fait que la proteine codee par le gene 
15 orfS* presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 9). 
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Tableau 9 



Proteine presentant une similitude 
significative 


Numero d'acces 
GenBank 


Score 
BLAST* 


Fonction 
rapportee 


AcrW {Streptomyces galilaeus) 


BAB72060 


94 


Transporteur 
ABC 


Daunorubicin resistance transmembrane 
proteine {Streptomyces peucetius) 


P32011 


89 


Resistance a la 
daunorubicine 


Probable ABC-transporter, 
transmembrane component. 
{Streptomyces coelicolor) 


NP_626506 


89 


Transporteur 
ABC 



* une plus grande similitude de sequence est associee a un score BLAST plus eleve 
(Altschul etal, 1990). 



Le gene or/9* code une proteine presentant une relative forte similitude avec une 
5 proteine de type transporteur ABC chez Streptomyces griseus (Campelo, 2002, Numero 
d'acces GenBank : CAC221 18 ; Score BLAST : 269). Cette similitude avec une proteine 
de type transporteur ABC suggere fortement que le gene or/9* code egalement une 
proteine de type transporteur ABC pouvant etre impliquee dans la resistance a la 
spiramycine. Cette hypothese est etayee par le fait que la proteine codee par le gene 
10 or/8* presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 10). 



Tableau 10 



Proteine presentant une similitude significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction 
rapportee 


Probable ABC-type transport protein, ATP- 
binding component (5. coelicolor) 


NP_626505 


231 


Transporteur 
ABC 
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Putative ABC transporter ATP-binding 


NP_627624 


228 


Transporteur 


component (Streptomyces Coelicolor) 






ABC 



* une plus grande similitude de sequence est associee a un score BLAST plus eleve 
(Altschul etal, 1990). 



Le gene orflO* code une proteine presentant une relative forte similitude avec une 
proteine de fonction inconnue. Cependant des genes similaires a or/10* sont retrouves 
5 au milieu de plusieurs groupes de genes impliques dans la biosynthese d'antibiotiques. 
Ainsi un gene proche de or/10* est retrouve chez S. coelicolor (Redenbach et aL, 1996, 
numero d'acces GenBank : NP_627432, score BLAST : 109). Un gene proche (CouY) 
est egalement retrouve chez S. rishiriensis (Wang et al., 2000, numero d'acces 
GenBank : AAG29779, score BLAST 97). 

10 

Genes situes en amont des genes codant les PKS 

Dans la sequence d'ADN situee en amont des genes codant les PKS (l'aval et 
l'amont etant defini par l'orientation des 5 genes de PKS tous orientes dans le meme 
sens) (cf. figure 3), 34 ORFs ont ete identifies (cf. ci-dessus). Ainsi, les 34 phases 

15 ouvertes de lecture de ce type, occupant une region d'environ 41,7 kb (cf. SEQ ID N° 1 
presentant une premiere region de 31 kb contenant 25 ORFs et SEQ ID N° 140 
presentant une region d'environ 12,1 kb dont 1,4 kb chevauchent la sequence precedente 
(SEQ ID N° 1) et environ 10,7 kb correspondent a la suite de la sequence), cette derniere 
partie d'environ 10,7 kb contenant 9 ORFs supplementaires (dont un ORF de sequence 

20 partielle), cf egalement figure 3 et 37 et ci-dessous). Une representation schematique de 
l'organisation de la region est presentee en figure 3 et 37. Les 34 genes identifies ont ete 
nommes : orfl, orf2, or/3, or/4, or/5, or/6, orf7, or/8, or/9c, or/10, orfllc, or/12, or/1 3c, 
orf!4, orfl 5c, orfl 6, orfl 7, or/18, orfl9, or/20, or/21 c, or/22c, or/23c, or/24c, or/25c, 
or/26, or/27, orf28c, or/29, or/30c, or/3f or/3 2c, or/33 et orf34c. 
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Dans le tableau 1 1 suivant sont presentees les references a la sequence en ADN et 
en acides amines des 34 genes identifies en amont des 5 genes PKS. 



Tableau 1 1 



Gene 1 


Position dans la 
sequence SEQ ID N 1 


Sequence ADN 


Sequence(s) polypeptidique(s) 2 


orfl 


658 a 1869 


SEQ ID N 23 


SEQ ID N 24 


or/2 


1866 a 2405 


SEQ ID N 25 


SEQ ID N 26et27 


or/3 


2402 a 3568 


SEQ ID N 28 


SEQ ID N 29 


orf4 


3565 a 4473 


SEQ ID N 30 


SEQ ID N 31, 32 et 33 


orp 


4457 a 5494 


SEQ ID N 34 


SEQ ID N 35 


orf6 


5491 a 6294 


SEQ ID N 36 


SEQ ID N 37, 38 et 39 


or/7 


6296 a 7705 


SEQ ID N 40 


SEQ ID N 41 et42 


orf8 


801 1 a 9258 


SEQ ID N 43 


SEQ ID N 44 


orf9c 


10081 a 9362 


SEQ ID N 45 


SEQ ID N 46 


orflO 


10656 a 12623 


SEQ ID N 47 


SEQ ID N 48 


orfllc 


14482 a 12734 


SEQ ID N 49 


SEQ ID N 50,51 et52 


orfll 


14601 a 16031 


SEQ ID N 53 


SEQ ID N 54, 55, 56, 57, 58 et 59 


orfl3c 


17489 a 16092 


SEQ ID N 60 


SEQ ID N 61 


orfl4 


17809 a 18852 


SEQ ID N 62 


SEQ ID N 63 


orfl 5 c 


20001 a 18961 


SEQ ID N 64 


SEQ ID N 65 


orp 6 


20314 a 21552 


SEQ ID N 66 


SEQ ID N 67 


orfl7 


21609 a 22879 


SEQ ID N 68 


SEQ ID N 69 


orfl8 


22997 a 24175 


SEQ ID N 70 


SEQ ID N 71 
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orfl9 


24177 a25169 


SEQ ID N 72 


SEQ ID N 73 


or/20 


25166 a 261 73 


SEQ ID N 74 


SEQ ID N 75 


orfllc 


27448 a 262 16 


SEQ ID N 76 


SEQ ID N 77 


orf22c 


28560 a 27445 


SEQ ID N 78 


SEQ ID N 79 


orf23c 


29770 a 28649 


SEQ ID N 80 


SEQ ID N 81 


orf24c 


30074 a 29763 


SEQ ID N 82 


SEQ ID N 83 


orf25c 


30937 a 30071 


SEQ ID N 84 


SEQ ID N 85 


Gene 1 


Position dans la 
sequence SEQ ID NO : 
140 


Sequence ADN 


Sequence(s) polypeptidique(s) 2 


or/26 


1647 a 2864 


SEQ ID N 107 


SEQ ID N 108 


or/27 


2914 a 3534 


SEQ ID N 109 


SEQ ID N 110 


or/28c 


4967 a 3804 


SEQ ID N° 141 


SEQ ID N° 142 


or/29 


5656 a 6663 


SEQ ID N 113 


SEQ ID N 114 


or/30c 


7723 a 6686 


SEQ ID N 115 


SEQ ID N 116 et 117 




7534 a 6686 


SEQ ID N° 143 


SEQ ID N° 144 


or/31 


7754 a 8728 


SEQ ID N 118 


SEQ ID N 119 


or/32c 


10488 a 8977 


SEQ ID N 145 


SEQ ID N 146 


or/33 


10562 a 10837 


SEQ ID N 147 


SEQ ID N 148 


or/3 4c 


12134 a 10899 


SEQ ID N 149 


SEQ ID N 150 



Le « c » ajoute dans le nom du gene indique que la sequence codante est dans 
1'orientation inverse (le brin codant est done le brin complementaire de la sequence 
donnee en SEQ ID N° 1 ou SEQ ID N° 140 pour ces genes). 



Lorsque plusieurs sequences proteiques sont indiquees pour une seule orf, les 
5 proteines correspondantes sont issues de plusieurs sites possibles de demarrage de la 
traduction. 
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Dans le but de determiner la fonction des polypeptides identifies dans le tableau 1 1 
ci-dessus, trois types d'experiences ont ete menees : la comparaison de l'identite des 
sequences identifies avec des sequences de fonctions connues, des experiences 
deactivation de genes et des analyses de la production en spiramycines de ces souches 
5 mutantes. 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont tout 
d'abord ete comparees avec celles presentes dans differentes bases de donnees grace a 
differents programmes : BLAST (Altschul et al, 1990) (Altschul et al. 9 1997), CD- 
search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. J. 
10 Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C. et aU 1995)), (cf. ci- 
dessus). Ces comparaisons ont permis de formuler des hypotheses sur la fonction des 
produits de ces genes et d'identifier ceux susceptibles d'etre impliques dans la 
biosynthese de spiramycine. Le tableau 12 montre les proteines presentant une forte 
similitude avec les 34 genes situes en amont des 5 genes PKS. 



15 Tableau 12 



Gene 


Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction 
rapportee 


orfl 


Cytochrome P450 tyll {Streptomyces 
fradiae) 


S49051 


530 


Cytochrome P450 


or/2 


ORF15x4 (Listonella anguillarum) 


AAB81630 


113 


Inconnue 


or/3 


aminotransferase-like protein 
{Streptomyces antibioticus) 


AAF59939 


431 


Amino- 
transferase 


orf4 


alpha-D-glucose- 1 -phosphate 
thymidylyltransferase {Streptomyces 
venezuelae) 


AAC68682 


404 


alpha-D-glucose- 
1 -phosphate 
thymidylyltransfe 
rase 


orf5 


AprE {Streptomyces tenebrarius) 


AAG18457 


476 


dTDP-glucose 
4,6-deshydratase 
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orf6 


Thioesterase {Streptomyces avermitilis) 


BAB69315 


234 


Thioesterase 


orfl 


TylCVI {Streptomyces fradiae) 


AAF29379 


461 


dNTP hexose 
2,3-deshydratase 


or/8 


probable aminotransferase 
{Saccharopolyspora spinosa) 


AAG23279 


465 


Aminotransferase 


otflc 


SrmX {Streptomyces ambofaciens) 


S25204 


445 


Methyltransferase 


orflO 


SrmR {Streptomyces ambofaciens) 


S25203 


1074 


Proteine de 
regulation 


orfllc 


SrmB {Streptomyces ambofaciens) 


S25202 


955 


Resistance a la 
spiramycine 


orfl2 


UrdQ {Streptomyces fradiae) 


AAF72550 


634 


NDP-hexose 3,4- 
deshydratase 


orfl 3c 


SC4H2.17 {Streptomyces coelicolor) 


T35116 


619 


Inconnue 


orfl4 


putative reductase {Streptomyces 
coelicolor) 


CAB90862 


147 


Reductase 


orfl 5 c 


Probable 3-ketoreductase {Streptomyces 
antibioticus) 


T51102 


285 


3-cetoreductase 


or/16 


Hypothetical NDP hexose 3,4 
isomerase {Streptomyces fradiae) 


CAA57471 


209 


NDP hexose 3,4 
isomerase 


orfl 7 


Glycosyl transferase {Streptomyces 
venezuelae) 


AAC68677 


400 


Glycosyl 
transferase 


orfl8 


Glycosyl transferase {Streptomyces 
rishiriensis) 


AAG29785 


185 


Glycosyl 
transferase 


orfl9 


NDP-hexose 4-cetoreductase TylCIV 
{Streptomyces fradiae) 


AAD41822 


266 


NDP-hexose 4- 
cetoreductase 


orf20 


EryBII {Saccharopolyspora erythraea) 


AAB84068 


491 


aldoceto 
reductase 


orfllc 


TylCIII {Streptomyces fradiae) 


AAD41823 


669 


NDP-hexose 3-C- 
methyltransferase 
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orfllc 


FkbH {Streptomyces hygroscopicus) 


AAF86387 


463 


Implique dans la 
biosynthese du 
methoxymalonyl 


or/23c 


Fkbl {Streptomyces hygroscopicus) 


AAF86388 


387 


Acyl CoA 
dehydrogenase 


orf24c 


FkbJ {Streptomyces hygroscopicus) 


AAF86389 


87 


Implique dans la 
biosynthese du 
methoxymalonyl 


or/25c 


FkbK {Streptomyces hygroscopicus) 


AAF86390 


268 


Acyl CoA 
dehydrogenase 


orf26 


TylCV {Streptomyces fradiae) 


AAD41824 


471 


Mycarosyl 
transferase 


orf27 


TylCVII {Streptomyces fradiae) 


AAD41825 


243 


NDP-hexose 3,5- 
(ou 5-) epimerase 


orf28c 


AcyB2 {Streptomyces thermotolerans) 


JC2032 


451 


proteine 
regulatrice 


or/29 


Beta-manannase {Sorangium 
cellulosum) 


AAK19890 


139 


Glycosyl 
hydrolase 


or/30c 


Epimerase de sucre-nucleoside- 
diphosphate {Corynebacterium 
glutamicum) 


NP_600590 


89 


Epimerase de 

sucre-nucleoside- 

diphosphate 


or/31 


Oxidoreductase {Streptomyces 
coelicolor) 


NP_631148 


261 


Oxidoreductase 


orf32c 


Proteine regulatrice de la famille GntR 
{Streptomyces avermitilis) 


NP_824604 


282 


Proteine 
regulatrice 


or/33 


Proteine hypothetique {Xanthomonas 
campestris) 


NP_635564 


54 


Inconnue 


orf34c 


Arabinofuranosidase {Streptomyces 
coelicolor) 


NP_630049 


654 


Arabinofuranosid 
ase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al., 1990). 
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Des experiences deactivation de genes ont ete realisees pour confirmer ces 
resultats. Les methodes utilisees consistent a effectuer un remplacement de gene. Le 
gene cible a interrompre est remplace par une copie de ce gene interrompue par une 
cassette conferant la resistance a un antibiotique (par exemple l'apramycine ou 
5 rhygromycine). Les cassettes utilisees sont bordees de part et d'autre par des codons de 
terminaison de la traduction dans toutes les phases de lecture et par des terminateurs de 
transcription actifs chez Streptomyces. L'insertion de la cassette dans le gene cible peut 
s'accompagner ou non d'une deletion dans ce gene cible. La taille des regions flanquant 
la cassette peut aller de quelques centaines a plusieurs milliers de paires de bases. Un 
10 deuxieme type de cassettes peut etre utilise pour rinactivation de genes : des cassettes 
dites « cassettes excisables » (cf. ci dessus). Les souches ainsi construites ont ete testees 
pour leur production en spiramycines. 

Le gene orfl code une proteine presentant une relative forte similitude avec 
plusieurs cytochrome P450. Notamment, la proteine codee par orfl possede une 

15 similitude importante avec la proteine codee par le gene tyll impliquee dans la 
biosynthese de tylosine chez Streptomyces fradiae (Merson-Davies,L.A. et aL, 1994 ; 
Numero d'acces GenBank : S49051 ; Score BLAST : 530). Cette similitude avec une 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
fortement que le gene orfl code egalement une cytochrome P450. Cette hypothese est 

20 etayee par le fait que la proteine codee par le gene orfl presente une forte similitude 
avec d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 13). 



Tableau 13 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative cytochrome P450 YJIB 
(Bacillus subtilis) 


034374 


248 


Cytochrome P450 
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Cytochrome P450 113A1 
(Saccharopolyspora erythraed) 


P48635 


237 


Cytochrome P450 


Cytochrome P-450 hydroxylase 
homolog {Streptomyces caelestis) 


AAC46023 


208 


Cytochrome P-450 
hydroxylase 


Cytochrome P450 monooxygenase 
{Streptomyces venezuelae) 


AAC64105 


206 


Cytochrome P450 
monooxygenase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1990). 



Le gene orfl code une proteine presentant une relative forte similitude avec une 
5 dTDP-6-deoxy-3,4-keto-hexulose isomerase de Aneurinibacillus thermoaerophilus 
(Pfoestl,A. et al. 9 2003, Numero d'acces GenBank : AAO06351 ; Score BLAST : 1 18). 
Cette similitude suggere fortement que le gene orfl code une isomerase responsable de 
la reaction d'isomerisation necessaire a la biosynthese d'un des sucres presents dans la 
molecule de spiramycine, ce sucre pouvant etre le mycarose (cf. figure 5). L'inactivation 
10 du gene orfl a ete realisee. II a pu etre montre que la souche resultante ne produit plus de 
spiramycines. Ceci confirme que le gene orfl est bien implique dans la biosynthese des 
spiramycines. 

Le gene orf3 code une proteine presentant une relative forte similitude avec 
plusieurs aminotransferases. Notamment, la proteine codee par or/3 possede une 

15 similitude importante avec une aminotransferase de Streptomyces antibioticus impliquee 
dans la biosynthese de 1' oleandomycin (Draeger,G., et al.,1999 ; Numero d'acces 
GenBank: AAF59939 ; Score BLAST: 431). Cette similitude avec une proteine 
impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere fortement 
que le gene orfl code une 3 amino-transferase responsable de la reaction de 

20 transamination necessaire a la biosynthese d'un des sucres amines des spiramycines (cf. 
figure 5). Cette hypothese est etayee par le fait que la proteine codee par le gene orfl 
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presente une forte similitude avec d'autres proteines de fonction similaire chez d'autres 
organismes (cf. tableau 15). 

Tableau 15 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Aminotransferase {Streptomyces 
antibioticus) 


T51111 


429 


Aminotransferase 


Transaminase {Streptomyces 
venezuelae) 


AAC68680 


419 


Transaminase 



une plus grande similitude de sequence est associee a un score BLAST plus 



5 eleve (Altschul et aL, 1 990). 

L'inactivation du gene orfi a ete realisee. II a ainsi pu etre montre que la souche 
resultante ne produit plus de spiramycines. Ceci confirme que le gene or/3 est bien 
implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle a la biosynthese des 

10 spiramycines. La production de spiramycines peut etre complementee par l'expression 
de la proteine TylB de S. fradiae (cf exemple 23). Ceci demontre que le gene or/3 code 
une 3 amino-transferase responsable de la reaction de transamination necessaire a la 
biosynthese du mycaminose (cf. figure 5). Comme le mycaminose est le premier sucre a 
etre fixe sur le platenolide, il est attendu que la souche interrompue dans or/3 (OS49.67) 

1 5 accumule du platenolide. 

Les intermedaires de biosynthese de la souche interrompue dans le gene or/3 ont 
ete etudies (cf. exemple 20). Ces experiences ont permis de demontrer que cette souche 
produit deux formes de platenolide : le platenolide A et le platenolide B, la structure 
deduite de ces deux molecules est presentee en figure 36. Cette souche produit 
20 egalement du platenolide A + mycarose et du platenolide B + mycarose (cf. exemple 20 
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et figure 40). Ces composes comportent un sucre mais ne comportent pas de 
myeaminose. De plus si on les compare a de la spiramycine (cf. figure 1), ces composes 
comportent du mycarose a la place du myeaminose. Ces resultats sont en accord avec 
rimplication du produit du gene or/3 dans la biosynthsee du myeaminose et son role en 
5 tant que 3 amino-transferase responsable de la reaction de transamination necessaire a la 
biosynthese du myeaminose (cf. figure 5). On peut remarquer que la specificite de 
glycosylation ne semble pas absolue puisque Ton trouve des molecules avec le mycarose 
fixe a la position noramalement occupee par le myeaminose (cf. figure 40). 

Le gene orf4 code une proteine presentant une relative forte similitude avec 
10 plusieurs NDP-glucose synthetases. Notamment, la proteine codee par orf4 possede une 
similitude importante avec une alpha-D-glucose-1 -phosphate thymidylyltransferase de 
Streptomyces venezuelae (Xue Y et a/., 1998 ; Numero d'acces GenBank : AAC68682 ; 
Score BLAST 404). Cette similitude avec une proteine impliquee dans la voie de 
biosynthese d'un autre antibiotique proche suggere fortement que le gene orf4 code une 
15 NDP-glucose syntethase responsable de la synthese du NDP-glucose necessaire a la 
biosynthese des trois sucres atypiques incorpores dans la molecule de spiramycine (cf. 
figure 4, 5 et 6). Cette hypothese est etayee par le fait que la proteine codee par le gene 
orf4 presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 16). 

20 



Tableau 16 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glucose- 1 -phosphate 
thymidyltransferase {Streptomyces 
avermitilis) 


BAA84594 


402 


Glucose- 1 -phosphate 
thymidyltransferase 
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AclY (Streptomyces galilaeus) 


BAB72036 


400 


dTDP-1 -glucose 
synthetase 


Putative glucose- 1 -phosphate 
thymidyltransferase 
(Saccharopolyspora spinosa) 


AAK83289 


399 


glucose- 1 -phosphate 
thymidyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al., 1990). 



Le gene or/5 code une proteine presentant une relative forte similitude avec 
plusieurs glucose deshydratases. Notamment, la proteine codee par orf5 possede une 

5 similitude importante avec une dTDP-glucose 4,6-deshydratase de Streptomyces 
tenebrarius (Li,T.B. et tf/.,2001 ; Numero d'acces GenBank : AAG18457, Score 
BLAST : 476). Cette similitude avec une proteine impliquee dans la voie de biosynthese 
d'un autre antibiotique proche suggere fortement que le gene orf5 code une NDP 
glucose dehydratase necessaire a la biosynthese des trois sucres atypiques incorpores 

10 dans la molecule de spiramycine (cf. figure 4, 5 et 6). Cette hypothese est etayee par le 
fait que la proteine codee par le gene or/5 presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 17). 



Tableau 17 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


DTDP-glucose 4,6-deshydratase 
(Saccharopolyspora spinosa) 


AAK83290 


464 


DTDP-glucose 4,6- 
deshydratase 


thymidine diphosphoglucose 4,6- 
deshydratase (Saccharopolyspora 
erythraea) 


AAA68211 


445 


thymidine 

diphosphoglucose 

4,6-deshydratase 
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dTDPglucose 4,6-deshydratase (EC 
4.2.1 .46) - {Streptomyces fradiae) 


S49054 


443 


dTDPglucose 4,6- 
deshydratase 


TDP-glucose-4,6-deshydratase 
{Streptomyces venezuelae) 


AAC68681 


421 


TDP-glucose-4,6- 
deshydratase 


SgcA {Streptomyces globisporus) 


AAF13998 


418 


dNDP-glucose-4,6- 
deshydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al., 1990). 



Le gene orf6 code une proteine presentant une relative forte similitude avec 
plusieurs thioesterases. Notamment, la proteine codee par orf6 possede une similitude 

5 importante avec une thioesterase de Streptomyces avermitilis (Omura,S. et al., 2001 ; 
Numero d'acces GenBank : BAB69315 ; Score BLAST : 234). Cette similitude avec une 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
fortement que le gene orf6 code egalement une thioesterase. Cette hypothese est etayee 
par le fait que la proteine codee par le gene orf6 presente une forte similitude avec 

10 d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 18). 



Tableau 18 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


RifR {Amycolatopsis mediterranex) 


AAG52991 


216 


Thioesterase 


Thioesterase - {Streptomyces fradiae) 


S49055 


215 


Thioesterase 


Thioesterase {Streptomyces 
avermitilis) 


BAB69188 


213 


Thioesterase 
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Thioesterase II (EC 3.1.2.-) - 
{Streptomyces venezuelae) 


T17413 


203 


Thioesterase 


PimI protein {Streptomyces natalensis) 


CAC20922 


201 


Thioesterase 


Thioesterase {Streptomyces griseus) 


CAC22116 


200 


Thioesterase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene or/7 code une proteine presentant une relative forte similitude avec 
plusieurs hexose dehydratases. Notamment, la proteine codee par or/7 possede une 

5 similitude importante avec une dNTP hexose 2,3-deshydratase (codee par le gene 
TylCVI) de Streptomyces fradiae impliquee dans la biosynthese de la tylosine (Merson- 
Davies,L-A. et al. 9 1994 ; Numero d'acces GenBank : AAF29379 ; Score BLAST : 461). 
Cette similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique proche suggere fortement que le gene orf7 code egalement une hexose 2-3 

10 dehydratase necessaire a la biosynthese de deux sucres atypiques incoipores dans la 
molecule de spiramycine (cf. figure 4 et 6). Cette hypothese est etayee par le fait que la 
proteine codee par le gene orf7 presente une forte similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 19). 



Tableau 19 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Rifl 8 (Amycolatopsis mediterranei) 


AAG52988 


459 


Hexose dehydratase 


SimB3 (Streptomyces antibioticus) 


AAK06810 


444 


dNDP-4-keto-6-deoxy- 
glucose-2,3-deshydratase 



15 * une plus grande similitude de sequence est associee a un score BLAST plus 

eleve (Altschul et al, 1990). 
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Le gene or/8 code une proteine presentant une relative forte similitude avec 
plusieurs aminotransferases. Notamment, la proteine codee par or/8 possede une 
similitude importante avec une aminotransferase probablement impliquee dans la 
biosynthese de la forosamine chez Saccharopolyspora spinosa (Waldron,C. et al. 9 2001 ; 

5 Numero d'acces GenBank : AAG23279 ; score BLAST : 465). Cette similitude avec une 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
fortement que le gene orf8 code une 4 amino-transferase responsable de la reaction de 
transamination necessaire a la biosynthese de la forosamine (cf. figure 6). Cette 
hypothese est etayee par le fait que la proteine codee par le gene or/8 presente une forte 

10 similitude avec d'autres proteines de fonction similaire chez d'autres organismes (cf. 
tableau 20). 



Tableau 20 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative amino-sugar biosynthesis 
protein (Bordetella bronchiseptica) 


CAA07666 


213 


Proteine impliquee dans la 
biosynthese d'amino-sucre 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL 9 1990). 



15 L'inactivation du gene or/8 a ete realisee. II a pu ainsi etre montre que la souche 

resultante ne produit plus de spiramycines. Ceci confirme que le gene or/8 est bien 
implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle a la biosynthese des 
spiramycines. La validation de Thypothese du role joue par le produit du gene or/8 dans 

20 la biosynthese de la forosamine est apportee par le fait qu'un mutant incative pour le 
gene or/8 produit de la forocidine, ce mutant est done bloque au stade de la forocidine et 
ne produit pas de neo-spiramycine (cf. figure 7 et exemple 25). Ces resultats sont en 
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accord avec une implication du produit du gene orf8 dans la biosynthese de forosamine 
(cf. figure 6). 

Le gene orf9c a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
srmXpar Geistlich et al. (GeistlichJVL, et aL, 1992). La similitude de la proteine codee 

5 par ce gene avec plusieurs methyltransferases impliquees dans la voie de biosynthese 
d'autres antibiotiques proches suggere fortement que le gene or9c code une methyl- 
transferase responsable de la reaction de methylation necessaire a la biosynthese du 
mycaminose ou de la forosamine (cf. figure 5 et 6). Cette hypothese est etayee par le fait 
que la proteine codee par le gene orf9c presente une forte similitude avec d'autres 

10 proteines de fonction similaire chez d'autres organismes (cf. tableau 21). 



Tableau 21 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


N,N-dimethyltransferase 
(Streptomyces venezuelae) 


AAC68678 


240 


N ? N- 

dimethyltransferase 


Methyltransferase (Streptomyces 
antibioticus) 


CAA05643 


232 


Methyltransferase 


Putative amino methylase 
(Streptomyces nogalater) 


AAF01819 


219 


Aminomethylase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al., 1990). 



Le gene orfl 0 a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
15 srmR par Geistlich et al (Geistlich,M., et al, 1992). La proteine codee par ce gene est 
impliquee dans la regulation de la voie de biosynthese des spiramycines chez 
Streptomyces ambofaciens. L'inactivation du gene orflO a ete realisee. II a pu ainsi etre 
montre que la souche resultante ne produit plus de spiramycines. Ceci confirme que le 
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gene orflO est bien implique dans la biosynthese des spiramycines. La proteine codee 
par ce gene est done bien essentielle a la biosynthese des spiramycines. 

D' autre part ; le point de demarrage de la traduction de orf 10 a ete determine et il 
a pu etre montre que la surexpression de ce gene entraine une amelioration de la 

5 production en spiramycines. Le site de demarrage de la traduction correspond a un ATG 
situe en amont de l'ATG propose par Geistlich et al. (Geistlich,M., et al., 1992). H a en 
outre ete demontre que cette extremite 5' est esentielle a la fonction de OrflO puisqu'un 
messager tronque en 5' est inactif (cf. exemple 17). Pour obtenir Feffet recherche sur la 
production en spiramycines, il est done essentiel que la surexpression de or/10 soit 

10 realisee en prenant garde de ne pas exprimer un messager tronque en 5' de orfl 0. 

Le gene orfllc a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
srmB par Geistlich et al. (Geistlich,M. et al., 1992) et Schoner et al. (Schoner B et al, 
1992). La proteine codee par ce gene est impliquee dans la resistance a la spiramycine 
chez Streptomyces ambofaciens et est un transporteur de type ABC. 

15 Le gene orfl 2 code une proteine presentant une relative forte similitude avec 

plusieurs hexose dehydratases. Notamment, la proteine codee par orfl 2 possede une 
similitude importante avec une NDP-hexose 3,4-deshydratase codee par le gene UrdQ 
de Streptomyces fradiae et impliquee dans la biosynthese de l'urdamycine 
(Hoffimeister,D. et al. 9 2000 ; Numero d'acces GenBank : AAF72550 ; Score BLAST : 

20 634). Cette similitude avec une proteine impliquee dans la voie de biosynthese d'un 
autre antibiotique proche suggere fortement que le gene orfl 2 code une 3,4 deshydratase 
responsable de la reaction de deshydratation necessaire a la biosynthese de la forosamine 
(cf. figure 6). Cette hypothese est etayee par le fait que la proteine codee par le gene 
orfl 2 presente une forte similitude avec d'autres proteines de fonction similaire chez 

25 d'autres organismes (cf. tableau 22). 
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Tableau 22 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


AknP {Streptomyces galilaeus) 


AAF73452 


625 


3 -dehydratase 


NDP-hexose 3,4-dehydratase homolog 
{Streptomyces cyanogenus) 


AAD13547 


624 


NDP-hexose 3,4- 
deshydratase 


Rdml {Streptomyces purpurascens) 


AAL24451 


608 


hexose-C-3- 
deshydratase 


Probable CDP-4-keto-6-deoxyglucose- 
3 -dehydratase (El) {Streptomyces 
violaceoruber) 


T46528 


602 


CDP-4-ceto-6- 

deoxyglucose-3- 

deshydratase 


Probable NDP-hexose-3,4-dehydratase 
{Saccharopolyspora spinosa) 


AAG23278 


582 


NDP-hexose-3,4- 
deshydratase 


dNTP-hexose dehydratase 
{Amycolatopsis mediterranei) 


AAC01730 


576 


dNTP-hexose 
dehydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1990). 



L'inactivation du gene orfll a ete realisee. II a pu etre montre que la souche 
5 resultante ne produit plus de spiramycines. Ceci confirme que le gene orfl2 est bien 
implique dans la biosynthese de la spiramycine. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle a la biosynthese de la 
spiramycine. La validation de Thypothese du role joue par Orfl2 dans la biosynthese de 
la forosamine est apportee par le fait qu'un mutant incative pour le gene orfl2 ne produit 
10 plus de forosamine. H produit cependant une faible quantite de forocidine. Ce mutant est 
done bloque au stade de la forocidine et ne produit pas de neo-spiramycine (cf. figure 7 
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et exemple 26). Ce mutant produit en outre un compose de structure presentee en figure 
38. Ce dernier compose comporte deux sucres, le mycaminose et le mycarose mais ne 
comporte pas de forosamine. De plus si on le compare a la structure de la spiramycine 
(cf. figure 1), ce compose comporte le sucre mycarose a la place attendue de la 
5 forosamine. Ces resultats sont en accord avec l'implication du produit du gene orfl2 
dans la biosynthsee de la forosamine (cf. figure 6). On peut remarquer que la specificite 
de glycosylation n'est pas absolue puisque Ton observe des molecules dans lesquelles le 
mycarose est fixe a la position normalement occupee par la forosamine (voir figure 38). 

Le gene orflic code une proteine presentant une relative forte similitude avec une 
10 proteine de fonction inconnue chez Streptomyces coelicolor. Cette proteine a ete 
nommee SC4H2.17 (numero d'acces GeneBank: T35116; Score BLAST: 619). La 
proteine codee par le gene orfl3c presente egalement une forte similitude avec d'autres 
proteines d'autres organismes (cf. tableau 23). 



Tableau 23 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


hflX protein {Mycobacterium leprae) 


S72938 


473 


Inconnue 


Possible ATP/GTP-binding protein 
{Mycobacterium leprae) 


NP_301739 


470 


Proteine fixant 
l'ATP/GTP 


GTP-binding protein {Mycobacterium 
tuberculosis CDC1551) 


AAK47114 


468 


Proteine fixant le 
GTP 


ATP/GTP-binding protein 
{Streptomyces fradiae) 


T44592 


388 


Proteine fixant 
l'ATP/GTP 



15 * une plus grande similitude de sequence est associee a un score BLAST plus 

eleve (Altschul et al, 1990). 
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Aucune fonction precise n'a ete assignee aux proteines proches de celle codee 
par orfl3c. L'inactivation du gene orfl3c a ete realisee dans le but d'etudier la fonction 
de ce gene dans la voie de biosynthese des spiramycines chez Streptomyces 
ambofaciens. II a pu etre montre que la souche resultante produit des spiramycines. Ceci 
5 indique que le gene orf!3c n'est pas essentiel a la biosynthese des spiramycines et qu'il 
n'est pas essentiel a la survie de la bacterie. L'enzyme codee par ce gene n'est done pas 
responsable d'une etape de bioconversion essentielle a la biosynthese des spiramycines. 

Le gene orfl4 code une proteine presentant une relative forte similitude avec une 
reductase putative (Redenbach,M., et al, 1996 ; Bentley et al., 2002 ; numero d'acces 
10 GenBank : CAB90862 ; Score BLAST : 147). 

L'inactivation du gene orfl4 a ete realisee. II a pu ainsi etre montre que la souche 
resultante ne produit plus de spiramycines. Ceci confirme que le gene orfl4 est bien 
implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle a la biosynthese des 
15 spiramycines. Les intermedaires de biosynthese de la souche interrompue dans le gene 
orfl4 ont ete etudies (cf. exemple 20). Ces experiences ont permis de demontrer que 
cette souche produit du platenolide A mais ne produit pas de platenolide B (cf. figure 
36). 

Le gene orflSc code une proteine presentant une relative forte similitude avec 
20 plusieurs cetoreductases. Notamment, la proteine codee par orflSc possede une 
similitude importante avec une 3-cetoreductase chez Streptomyces antibioticus (Numero 
d'acces GenBak : T51102, Score BLAST : 285). Cette similitude suggere fortement que 
le gene orflSc code une 3 ceto-reductase responsable de la reaction de reduction 
necessaire a la biosynthese de la forosamine (cf. figure 6). Cette hypothese est etayee par 
25 le fait que la proteine codee par le gene orflSc presente une forte similitude avec 
d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 24). 
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Tableau 24 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


oxidoreductase homolog {Streptomyces 
cyanogenus) 


AAD13550 


272 


Oxidoreductase 


D-oliose 4-cetoreductase 
{Streptomyces argillaceus) 


CAB96550 


265 


D-oliose 4- 
cetoreductase 


AknQ {Streptomyces galilaeus) 


AAF73453 


263 


putative 3- 
cetoreductase 


Probable NDP-hexose-3-ketoreductase 
{Saccharopolyspora spinosa) 


AAG23275 


253 


NDP-hexose-3- 
cetoreductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1990). 



Le gene orfl6 code une proteine presentant une relative forte similitude avec 
5 plusieurs isomerases. Notamment, la proteine codee par orfl6 possede une similitude 
importante avec une NDP hexose 3,4 isomerase chez Streptomyces fradiae (Gandecha et 
aL, 1997 ; Numero d'acces GenBak : CAA57471, Score BLAST : 209). Cette similitude 
suggere fortement que le gene orfl6 code une proteine impliquee dans la biosynthese 
d'un des sucres de la spiramycine (cf. figure 5 et 6). Cette hypothese est etayee par le fait 
10 que la proteine codee par le gene orfl6 presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 25). 
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Tableau 25 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative tautomerase (Streptomyces 
venezuelae) 


AAC68676 


145 


Tautomerase 


TDP-4-ceto-6-deoxyhexose 3,4- 
isomerase (Micromonospora 
megalomicea subsp. nigra) 


AAG13907 


112 


TDP-4-ceto-6- 
deoxyhexose 3,4- 
isomerase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene orfl7 code une proteine presentant une relative forte similitude avec 
5 plusieurs glycosyl transferases. Notamment, la proteine codee par orfl 7 possede une 
similitude importante avec une glycosyl transferase de Streptomyces venezuelae (Xue,Y. 
et al, 1998; Numero d'acces GenBank: AAC68677 ; score BLAST: 400). La 
similitude de la proteine codee par le gene orfl 7 avec plusieurs glycosyl transferases 
impliquees dans la voie de biosynthese d'autres antibiotiques proches suggere fortement 
10 que ce gene code egalement une glycosyl transferase. Cette hypothese est etayee par le 
fait que la proteine codee par le gene orfl 7 presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 26). 



Tableau 26 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glycosyltransferase (Streptomyces 
fradiae) 


CAA57472 


399 


Glycosyltransferase 



60 



Glycosyltransferase {Streptomyces 
antibioticus) 


CAA05642 


378 


Glycosyltransferase 


Glycosyltransferase {Streptomyces 
antibioticus) 


CAA05641 


360 


Glycosyltransferase 


Glycosyltransferase 
{Saccharopolyspora erythraea) 


CAA74710 


344 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al., 1990). 



Le gene orfl8 code une proteine presentant une relative forte similitude avec 
plusieurs glycosyl transferases. Notamment, la proteine codee par orfl8 possede une 

5 similitude importante avec une glycosyl transferase de Streptomyces rishiriensis (Wang 
et tf/.,2000; Numero d'acces GenBank: AAG29785 ; score BLAST: 185). La 
similitude de la proteine codee par le gene orfl8 avec plusieurs glycosyl transferases 
impliquees dans la voie de biosynthese d'autres antibiotiques proches suggere fortement 
que ce gene code egalement une glycosyl transferase. Cette hypothese est etayee par le 

10 fait que la proteine codee par le gene orfl8 presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 27). 



Tableau 27 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


NovM {Streptomyces spheroides) 


AAF67506 


184 


Glycosyltransferase 


probable glycosyl transferase 
{Streptomyces violaceoruber) 


T46519 


169 


Glycosyltransferase 



61 



Glycosyl transferase homolog 
(Streptomyces cyanogenus) 


AAD13553 


167 


Glycosyltransferase 


Glycosyl transferase homolog 
{Streptomyces cyanogenus) 


AAD13555 


163 


Glycosyltransferase 


dNTP-hexose glycosyl transferase 
(Amycolatopsis mediterranei) 


AAC01731 


160 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1990). 



Le gene orfl9 code une proteine presentant une relative forte similitude avec 
5 plusieurs cetoreductases. Notamment, la proteine codee par or/19 possede une similitude 
importante avec une NDP-hexose 4-cetoreductase (TylCIV) de Streptomyces fradiae 
(Bate et a/.,2000 ; Numero d'acces GenBank : AAD41822 ; score BLAST : 266). La 
similitude de la proteine codee par le gene or/19 avec cette cetoreductase impliquee dans 
la voie de biosynthese d'un antibiotique proche suggere fortement que ce gene code 
10 egalement une 4-cetoreductase responsable de la reaction de reduction necessaire a la 
biosynthese du mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la 
proteine codee par le gene or/19 presente une forte similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 28). 



Tableau 28 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


NDP-4-ceto-6-deoxyhexose 4- 
cetoreductase (Streptomyces venezuelae) 


AAL14256 


251 


NDP-4-ceto-6- 
deoxyhexose 4- 
cetoreductase 



62 



EryBIV (Saccharopolyspora erythraea) 


AAB84071 


249 


oxidoreductase 


TDP-4-ceto-6-deoxyhexose 4- 
cetoreductase {Micromonospora 
megalomicea subsp. Nigra) 


AAG13916 


218 


TDP-4-ceto-6- 
deoxyhexose 4- 
cetoreductase 


dTDP-4-ceto-6-deoxy-L-hexose 4- 
reductase {Streptomyces avermitilis) 


BAA84595 


212 


dTDP-4-ceto-6- 
deoxy-L-hexose 4- 
reductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene or/20 code une proteine presentant une relative forte similitude avec 
plusieurs hexose reductases. Notamment, la proteine codee par or/20 possede une 

5 similitude importante avec le gene EryBII de Saccharopolyspora erythraea qui code une 
dTDP-4-ceto-L-6-deoxy-hexose 2,3-reductase (Summers ? R.G., et al,\991), Numero 
d'acces GenBank : AAB84068 ; Score BLAST : 491). La similitude de la proteine codee 
par le gene or/20 avec plusieurs hexose reductases impliquees dans la voie de 
biosynthese d'autres antibiotiques proches suggere fortement que ce gene code une 2-3 

10 reductase responsable de la reaction de reduction necessaire a la biosynthese du 
mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la proteine codee par le 
gene orf20 presente une forte similitude avec d'autres proteines de fonction similaire 
chez d'autres organismes (cf. tableau 29). 



Tableau 29 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


TylCII {Streptomyces fradiae) 


AAD41821 


464 


NDP-hexose 2,3- 
enoyl reductase 



63 



TDP-4-ceto-6-deoxyhexose 2,3- 
reductase (Micromonospora 
megalomicea subsp. Nigra) 


AAG13914 


446 


TDP-4-ceto-6- 
deoxyhexose 2,3- 
reductase 


dTDP-4-ceto-6-deoxy-L-hexose 2,3- 
reductase {Streptomyces avermitilis) 


BAA84599 


377 


dTDP-4-ceto-6- 
deoxy-L-hexose 
2,3-reductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al., 1990). 



Le gene orf21c code une proteine presentant une relative forte similitude avec 
plusieurs hexose methyltransferases. Notamment, la proteine codee par orftlc possede 

5 une similitude importante avec le gene TylCIII de Streptomyces fradiae qui code une 
NDP-hexose 3-C-methyltransferase (Bate,N et al, 2000 ; Numero d'acces GenBank : 
AAD41823 ; Score BLAST : 669). La similitude de la proteine codee par le gene orfllc 
avec plusieurs hexose methyltransferases impliquees dans la voie de biosynthese 
d'autres antibiotiques proches suggere fortement que ce gene code une hexose 

10 methyltransferase responsable de la reaction de methylation necessaire a la biosjmthese 
du mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la proteine codee 
par le gene orfllc presente une forte similitude avec d'autres proteines de fonction 
similaire chez d'autres organismes (cf. tableau 30). 



Tableau 30 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee , 


EryH {Saccharopolyspora erythraea) 


228448 


592 


Gene de 
biosynthese de 
1' erythromycin 



64 



S-adenosyl-dependent methyl 
transferase (Coxiella burnetii) 


AAK71270 


358 


Methyltransferase 


NovU {Streptomyces spheroides) 


AAF67514 


184 


C-methyltransferase 



une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et aL, 1990). 

Le gene orf22c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene fkbH de Streptomyces hygroscopicus var. ascomyceticus qui 
5 code une enzyme impliquee dans la biosynthese du methoxymalonyl (Wu,K. et 
a/.,2000 ; Numero d'acces GenBank : AAF86387 ; Score BLAST : 463). La similitude 
de la proteine codee par le gene orf22c avec cette proteine impliquee dans la voie de 
biosynthese d'un autre macrolide proche suggere fortement que ce gene code egalement 
une enzyme impliquee dans la biosynthese du methoxymalonyl chez Streptomyces 
10 ambofaciens (cf. figure 8). 

Le gene orf23c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene fkbl de Streptomyces hygroscopicus var. ascomyceticus qui 
code une acyl CoA dehydrogenase impliquee dans la biosynthese du methoxymalonyl 
(Wu,K. et aL, 2000 ; Numero d'acces GenBank : AAF86388 ; Score BLAST 387). La 

15 similitude de la proteine codee par le gene orf23c avec plusieurs acyl CoA 
dehydrogenases impliquees dans la voie de biosynthese d'autres antibiotiques proches 
suggere fortement que ce gene code une acyl CoA dehydrogenase impliquee dans la 
biosynthese du methoxymalonyl (cf. figure 8). Cette hypothese est etayee par le fait que 
la proteine codee par le gene orf23c presente une forte similitude avec d'autres proteines 

20 de fonction similaire chez d'autres organismes (cf. tableau 31). 
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Tableau 3 1 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Acyl-CoA dehydrogenase 
(Polyangium cellulosum) 


AAK19892 


171 


Acyl-CoA 
dehydrogenase 


Probable acyl-CoA dehydrogenase - 
{Streptomyces coelicolor) 


T36802 


160 


acyl-CoA 
deshydrogenase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et a/., 1990). 



Le gene orf24c code une proteine presentant une relative forte similitude avec la 
5 proteine codee par le gene fkbJ de Streptomyces hygroscopicus var. ascomyceticus qui 
coderait la proteine de liaison du groupement acyl (Acyl Carrier Protein (ACP)) 
impliquee dans la biosynthese du methoxymalonyl (Wu,K., et al., 2000 ; Numero 
d'acces GenBank : AAF86389 ; Score BLAST : 87). La similitude de la proteine codee 
par le gene orf24c avec cette proteine impliquees dans la voie de biosynthese d'un autre 
10 macrolide proche suggere fortement que ce gene code une proteine impliquee dans la 
biosynthese du methoxymalonyl chez Streptomyces ambofaciens (cf. figure 8). 

Le gene orf25c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene fkbK de Streptomyces hygroscopicus var. ascomyceticus qui 
code une acyl CoA deshydrogenase impliquee dans la biosynthese du methoxymalonyl 

15 (Wu,K., et al. 9 2000 ; Numero d'acces GenBank : AAF86390 ; score BLAST : 268). La 
similitude de la proteine codee par le gene orf25c avec plusieurs acyl CoA 
dehydrogenases impliquees dans la voie de biosynthese d'autres antibiotiques proches 
suggere fortement que ce gene code une acyl CoA deshydrogenase impliquee dans la 
biosynthese du methoxymalonyl (cf. figure 8). Cette hypothese est etayee par le fait que 

20 la proteine codee par le gene orf25c presente une forte similitude avec d'autres proteines 
de fonction similaire chez d'autres organismes (cf. tableau 32). 
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Tableau 32 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenRank 


Score 
BLAST* 


Fonction rapportee 


Probable 3-Hydroxybutyryl-CoA 
Dehydrogenase (Bacillus subtilis) 


P45856 


177 


3 -Hydroxybutyryl- 
CoA dehydrogenase 


3-hydroxybutyryl-CoA dehydrogenase 
protein (Bacillus thuringiensis serovar 
kurstaki) 


AAL32270 


174 


3 -hydroxybutyryl- 
CoA dehydrogenase 


3-hydroxybutyryl-CoA dehydrogenase 
(Deinococcus radiodurans) 


NP_294792 


167 


3 -hydroxybutyryl- 
CoA dehydrogenase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al, 1990). 

Le gene orf26 code une proteine presentant une identite de 65% (determinee grace 
5 au programme BLAST) avec la proteine codee par le gene tylCV qui code une mycarosyl 
transferase impliquee dans la biosynthese de tylosine chez Streptomyces fradiae (Bate,N. 
et aL 9 2000; Numero d'acces GenBank : AAD41824, Score BLAST: 471). Plus 
particulierement, TylCV est une glycosyl-transferase liant la molecule de mycarose lors 
de la synthese de la tylosine. Cette similitude avec une proteine impliquee dans la voie 
10 de biosynthese d'un autre antibiotique relativement proche et plus particulierement dans 
le transfer! du mycarose, suggere que le gene or/26 code une glycosyl transferase. Cette 
hypothese est etayee par le fait que la proteine codee par le gene orf26 presente une forte 
similitude avec d'autres proteines de fonction similaire chez d'autres organismes (cf. 
tableau 33). 

15 



67 



Tableau 33 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

LrentsanK 


Score 
BLAST* 


Fonction rapportee j 


Glycosyl transferase {Streptornyces 
avermitilis) 


BAA84592 


218 


Glycosyl transferase 


CalG4 {Micromonospora echinospora) 


AAM70365 


217 


Glycosyl transferase 


CalG2 {Micromonospora echinospora) 


AAM70348 


197 


Glycosyl transferase 



une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al. y 1990). 

Le gene orf27 code une proteine presentant une identite de 70% (determinee grace 
5 au programme BLAST) avec la proteine codee par le gene tylCVII qui code une NDP- 
hexose 3,5- (ou 5-) epimerase impliquee dans la biosynthese de tylosine chez 
Streptornyces fradiae (Bate,N. et aL, 2000 ; Numero d'acces GenBank: AAD41825, 
Score BLAST: 243). Plus particulierement, TylCVII est une hexose 3,5- (ou 5-) 
epimerase impliquee dans la biosynthese du mycarose. Cette similitude avec une 

10 proteine impliquee dans la voie de biosynthese d'un autre antibiotique relativement 
proche et plus particulierement dans la biosynthese du mycarose, suggere que le gene 
or/27 code une epimerase. Cette hypothese est etayee par le fait que la proteine codee 
par le gene orfll presente une forte similitude avec d'autres proteines de fonction 
similaire chez d'autres organismes (cf. tableau 34). Une analyse des sequences proches 

15 obtenues grace au programme BLAST suggere fortement que le gene orf27 code une 5 
epimerase responsable de la reaction d'epimerisation necessaire a la biosynthese du 
mycarose (cf. figure 4). 
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Tableau 34 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


LanZl {Streptomyces cyanogenus) 


AAD13558 


172 


NDP-hexose 3,5- 
epimerase 


Epi (Saccharopolyspora spinosa) 


AAK83288 


169 


TDP-4-keto-6- 
deoxyglucose 3,5 
epimerase 


dNTP-hexose 3,5 epimerase 
(Amycolatopsis mediterranei) 


AAC01732 


166 


dNTP-hexose 3,5 
epimerase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1990). 



La sequence d'or/28c a dans un premier temps ete determinee de maniere partielle, 
5 puisque la sequence d'une region d'environ 450 paires de bases n'a ete determinee 
qu'apres resequensage (cette region est symbolisee par des «N» dans la sequence 
incomplete SEQ ID N° 106). La sequence partielle de cette ORF (SEQ ID N° 111) a 
neanmoins ete utilisee pour 1' analyse avec les differents programmes informatiques 
comme explique ci-dessus. D a ainsi pu etre determine que le gene orfl 8c code une 

10 proteine presentant une identite de 64% sur la sequence determinee (SEQ ID N° 1 12, qui 
est la sequence partielle de la proteine Orf28c) (determinee grace au programme 
BLAST) avec la proteine codee par le gene acyB2 qui code une proteine regulatrice 
impliquee dans la biosynthese de carbomycine chez Streptomyces thermotolerans 
(Arisawa,A., et al 9 1993 ; Numero d'acces GenBank : JC2032, Score BLAST : 329). 

15 Cette similitude avec une proteine impliquee dans la voie de biosynthese d'un 
antibiotique relativement proche suggere que le gene orf28c code une proteine 
regulatrice impliquee dans la biosynthese des spiramycines. Cette hypothese est etayee 
par le fait que la proteine codee par le gene orf28c presente egalement une forte 
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similitude avec la proteine TylR qui est une proteine regulatrice impliquee dans la 
biosynthese de tylosine chez Streptomyces fradiae (Bate,N. et al., 1999; Numero d'acces 
GenBank : AAF29380, Score BLAST : 167). 

Le gene orf28c a. pu etre amplifie grace a des oligonucleotides situes de part et 
5 d'autre de la sequence non determinee et sous clone dans un vecteur d'expression. H a 
pu ainsi etre demontre que la surexpression du gene orf28c augmente significativement 
la production en spiramycines de la souche OSC2 (cf. exemple 24). Ceci demontre que 
la surexpression de orf28c conduit a une augmentation de la production en spiramycines 
et confirme son role en tant que regulateur de la voie de biosynthese des spiramycines. 

10 La sequence partielle d*or/28c a ete completee par la suite et la region manquante 

d'environ 450 paires de bases a ete determinee (cf. SEQ ID N° 140 et SEQ ID N° 141). 
La sequence complete de cette ORF (SEQ ID N° 141) a ete utilisee pour l'analyse avec 
les differents programmes informatiques comme explique ci-dessus. II a ainsi pu etre 
determine que le gene orf28c code une proteine presentant une identite de 69% sur la 

15 sequence determinee (SEQ ID N° 142, qui est la sequence complete de la proteine 
Orf28c) (determinee grace au programme BLAST) avec la proteine codee par le gene 
acyB2 qui code une proteine regulatrice impliquee dans la biosynthese de carbomycine 
chez Streptomyces thermotolerans (Arisawa,A., et al., 1993 ; Numero d'acces 
GenBank : JC2032, Score BLAST : 451). Cette similitude avec une proteine impliquee 

20 dans la regulation de la biosynthese d'un antibiotique relativement proche suggere que le 
gene orf28c code une proteine regulatrice impliquee dans la biosynthese des 
spiramycines. Cette hypothese est etayee par le fait que la proteine codee par le gene 
orf28c presente egalement une forte similitude avec la proteine TylR qui est une proteine 
regulatrice impliquee dans la regulation de la biosynthese de tylosine chez Streptomyces 

25 fradiae (Bate,N. et al, 1999; Numero d'acces GenBank : AAF29380, Score BLAST : 
224). Les resultats de la surexpression de ce gene (cf. exemple 24) confirment son role 
en tant que regulateur de la voie de biosynthese des spiramycines. 
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L'inactivation du gene or/28c a ete realisee. II a pu ainsi etre montre que la souche 
resultante ne produit plus de spiramycines. Ceci confirme que le gene or/28c est bien 
implique dans la biosynthese des spiramycines et est essentiel a la biosynthese des 
spiramycines. Ces resultats associes aux resultats de la surexpression de ce gene (cf. 
5 exemple 24) sont en accord avec un role d'activateur essentiel a la biosynthese des 
spiramycines d'Orf28c. 

Le gene or/29 code une proteine presentant une identite de 31% (determinee grace 
au programme BLAST) avec une probable glycosyl hydrolase localisee dans le groupe 
de genes implique dans la biosynthese de soraphen A (un antifongique de la classe des 

10 polyketides) chez Sorangium cellulosum (Ligon,J., et al. y 2002 ; Numero d'acces 
GenBank: AAK19890, Score BLAST: 139). Cette similitude avec une proteine 
impliquee dans la voie de biosynthese d'une molecule relativement proche suggere que 
le gene orf29 code une proteine ayant une activite glycosyl hydrolase. Cette hypothese 
est etayee par le fait que la proteine codee par le gene or/29 presente une forte similitude 

15 avec d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 35). 
Une analyse de la sequence de la proteine codee par or/29 grace au programme CD- 
search (cf. ci-dessus) suggere egalement que le gene or/29 code une glycosyl hydrolase. 



Tableau 35 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


ManA (Caldicellulosiruptor 
saccharolyticus) 


AAC44232 


136 


beta- 1 ,4-mannanase 


ManA (Dictyoglomus thermophilum) 


AAB82454 


129 


beta-mannanase 



* une plus grande similitude de sequence est associee a un score BLAST plus eleve 
20 (Altschul et al. y 1990). 

L'analyse de la sequence proteique deduite de Vor/29 par le programme SignalP 
(http://www.cbs.dtu.dk/services/SignalP/) (Nielsen,H., et al. 9 1997) montre que cette 



71 



proteine possede une sequence signal C-terminale avec un site de coupure predit entre 
les positions 30 et 3 1 (QSA/QA). On peut predire que cette proteine est extra-cellulaire. 
Elle pourrait, en temps que glycosyl-hydrolase, avoir un role dans la reactivation de la 
spiramycine inactive par glycosylation par les glycosyl-transferases GimA et/ou GimB 
5 (Gourmelen et al, 1 998). 

Le gene orftOc code une proteine presentant une identite de 31% (determinee 
grace au programme BLAST) avec une epimerase de sucre-nucleoside-diphosphate de 
Corynebacterium glutamicum (Numero d'acces GenBank : NP_600590, Score BLAST : 
89). Cette similitude suggere que le gene or/30c code une epimerase. Cette hypothese est 
10 etayee par le fait qu'une analyse de la sequences grace au programme CD-search (cf. ci- 
dessus) suggere egalement que le gene orfiOc code une epimerase. 

UorfiOc presente deux codons d'initiations possibles (cf. SEQ ID N° 115) qui 
donnent deux proteines possibles de 345 et 282 acides amines respectivement (SEQ ID 
N° 116 et 117). Toutefois, 1 'usage des codons est typique de Streptomyces seulement a 

15 partir du deuxieme ATG de plus, la sequence proteique deduite de la sequence entre le 
premier ATG et le deuxieme ne s'aligne pas avec les sequences proches identifies, 
alors que la sequence proteique la plus courte (a partir du 2* me ATG : SEQ ID N° 144) 
s'aligne bien avec le debut de ces proteines. On peut done en deduire que le deuxieme 
ATG est le bon codon d'initiation et que la sequence de cet orf est done celui presente 

20 en SEQ ID N° 143 qui une fois traduit corespond a la proteine de sequence SEQ ID N° 
144. 

Le gene or/31 code une proteine presentant une identite de 52% (determinee grace 
au programme BLAST) avec une oxidoreductase chez Streptomyces coelicolor (Numero 
d'acces GenBank : NP_631148, Score BLAST : 261). Cette similitude suggere que le 
25 gene or/31 code une reductase. Cette hypothese est etayee par le fait qu'une analyse de 
la sequences grace au programme CD-search (cf. ci-dessus) suggere egalement que le 
gene or/31 code une reductase. Cette hypothese est egalement etayee par le fait que la 
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proteine codee par le gene orfil presente une forte similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 36). 

Tableau 36 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative oxidoreductase (Streptomyces 
griseus) 


BAB79295 


173 


Oxidoreductase 


MocA (Xanthomonas axonopodis) 


NP_640644 


171 


Oxidoreductase 



* une plus grande similitude de sequence est associee a un score BLAST plus eleve 



5 (Altschule/a/., 1990). 

L'inactivation du gene orfil a ete realisee. II a pu ainsi etre montre que la souche 
resultante ne produit plus de spiramycines. Ceci confirme que le gene orfil est bien 
implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle a la biosynthese des 
10 spiramycines. 

La sequence d'orfi2c a tout d'abord ete determinee de maniere partielle (cf. 
exemple 19), puisque la sequence codante en 5' n'a ete determinee que dans un second 
temps. La sequence partielle de cette orf (SEQ ED N° 120) a neanmoins ete utilisee pour 
Tanalyse avec les differents programmes informatiques comme explique ci-dessus. II a 

15 ainsi pu etre determine que le gene orfi2c code une proteine presentant une identite de 
47% sur la sequence determinee (SEQ ID N° 121, qui est la sequence partielle de la 
proteine Orf32c) (determinee grace au programme BLAST) avec une proteine 
regulatrice de la famille GntR chez Streptomyces coelicolor (Numero d'acces GenBank : 
NP_625576, Score BLAST : 229). Cette similitude suggere que le gene orfi2c code un 

20 regulateur transcriptionel de la famille GntR. Cette hypothese est etayee par le fait que la 
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proteine codee par le gene orf32c presente une forte similitude avec d'autres proteines 
de fonction similaire chez d'autres organismes. 

La sequence partielle d' or/3 2c a ete completee par la suite et la region manquante 
a ete determinee (cf. SEQ ID N° 140 et SEQ ID N° 145). La sequence complete de cette 

5 orf code une proteine presentant une identite de 44% (determinee grace au programme 
BLAST) avec une proteine regulatrice de la famille GntR chez Streptomyces avermitilis 
(Numero d'acces GenBank : NP_824604, Score BLAST : 282). Cette similitude suggere 
que le gene orf32c code un regulateur transcriptionel de la famille GntR. Cette 
hypothese est etayee par le fait que la proteine codee par le gene orf32c presente une 

10 forte similitude avec d'autres proteines de fonction similaire chez d'autres organismes 
(cf. tableau 37). 



Tableau 37 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Proteine regulatrice de la famille GntR 
(Streptomyces avermitilis) 


NP_828241 


270 


Proteine regulatrice 
de la famille GntR 


Proteine regulatrice de la famille GntR 

Streptomyces coelicolor) 


NP_625576 


266 


Proteine regulatrice 
de la famille GntR 


SC5G8.04 (Streptomyces coelicolor) 


NP_628991 


258 


Proteine regulatrice 
de la famille GntR 


transcriptional regulator (Streptomyces 
venezuelae) 


AAF01064 


224 


Regulateur 
transcriptionel 


Proteine regulatrice de la famille GntR 

(Streptomyces avermitilis) 


NP_827432 


239 


Proteine regulatrice 
de la famille GntR 
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* une plus grande similitude de sequence est associee a un score BLAST plus eleve 
(Altschul etal, 1990). 

L'inactivation du gene orf32c a ete realisee dans le but d'etudier la fonction de ce 
gene dans la voie de biosynthese des spiramycines chez Streptomyces ambofaciens. II a 
5 pu etre montre que la souche resultante produit des spiramycines. Ceci indique que le 
gene orf32c n'est pas essentiel a la biosynthese des spiramycines et qu'il n'est pas 
essentiel a la survie de la bacterie. 

Le gene or/33 code une proteine presentant une identite de 49% (determinee grace 
au programme BLAST) avec une proteine hypothetique de Xanthomonas campestris 
10 (Numero d'acces GenBank : NP_635564, Score BLAST : 54). 

La sequence d'or/34c est partielle. En effet, les comparaisons effectuees entre le 
produit de cette orf et les banques de donnees suggerent que la partie C-terminale de 
cette proteine n'est pas dans le produit deduit de la sequence nucleotidique et done que 
cette orf serait plus longue et continuerait en dehors de la region sequencee. La sequence 

15 partielle de cette ORF a neanmoins ete utilisee pour 1 'analyse avec les differents 
programmes informatiques comme explique ci-dessus. II a ainsi pu etre determine que le 
gene orf34c code une proteine presentant une identite de 91% sur la sequence 
determinee (SEQ ED N° 150, qui est la sequence partielle de la proteine Orf34c) 
(determinee grace au programme BLAST) avec une arabinofuranosidase de chez 

20 Streptomyces coelicolor (Bentley et al., 2002; Numero d'acces GenBank : NP_630049, 
Score BLAST : 654). Chez S. coelicolor le gene codant cette arabinofuranosidase ne 
semble pas implique dans la biosynthese de metabolite secondaire. Chez S. ambofaciens, 
ce gene n'est done probablement pas implique dans la biosynthese de spiramycine. 

La presente invention a egalement pour objet des polynucleotides s'hybridant 
25 dans des conditions d'hybridation de forte stringence a au moins l'un des 
polynucleotides de sequence SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 
34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 
111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, ou l'un de ses variants ou l'une des 
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sequences derivees de celles-ci en raison de la degenerescence du code genetique. 
Preferentiellement, cesdit polynucleotides sont isoles a partir d'une bacterie du genre 
Streptomyces, plus preferentiellement, ces polynucleotides codent des proteines 
impliquees dans la biosynthese d'un macrolide et encore plus preferentiellement, ces 
5 polynucleotides codent une proteine ayant une activite similaire a la proteine codee par 
les polynucleotides avec lesquels ils s'hybrident. Les conditions d'hybridation de forte 
stringence peuvent etre definies comme des conditions d'hybridation defavorisant 
Thybridation de brins d'acides nucleiques non homologues. Des conditions 
d'hybridations de forte stringence peuvent etre par exemple decrites comme des 

10 conditions d'hybridation dans le tampon decrit par Church & Gilbert (Church & 
Gilbert, 1984) a une temperature comprise entre 55°C et 65°C, de maniere preferee la 
temperature d'hyridation est de 55°C, de maniere encore plus preferee la temperatue 
d'hybridation est de 60°C et de maniere tout a fait preferee la temperature d'hybridation 
est de 65°C, suivi d'un ou plusieurs lavages effectue en tampon 2X SSC a une 

15 temperature comprise entre 55°C et 65°C, de maniere preferee cette temperature est de 
55°C, de maniere encore plus preferee cette temperatue est de 60°C et de maniere tout a 
fait preferee cette temperature est de 65°C, suivi d'un ou plusieurs lavages en tampon 
0.5X SSC a une temperature comprise entre 55°C et 65°C, de maniere preferee cette 
temperature est de 55°C, de maniere encore plus preferee cette temperatue est de 60°C 

20 et de maniere tout a fait preferee cette temperature est de 65 °C. Les conditions 
d'hybridation ci-dessus decrites peuvent etre adaptees en fonction de la longueur de 
l'acide nucleique dont Thybridation est recherchee ou du type de marquage choisi, selon 
des techniques connues de l'homme du metier. Les conditions convenables 
d'hybridation peuvent par exemple etre adaptees selon l'ouvrage de F.Ausubel et al. 9 

25 2002. 

L'invention concerne egalement un polynucleotide ayant au moins 70%, de fa?on 
plus preferee 80%, de fagon plus preferee 85%, de fa?on encore plus preferee 90%, de 
fa<?on encore plus preferee 95% et de maniere tout a fait preferee 98% d'identite en 
nucleotides avec un polynucleotide comprenant au moins 10, 12, 15, 18, 20 a 25, 30, 
30 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 
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750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 
1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 ou 1900 nucleotides consecutifs d'un 
polynucleotide choisi dans le groupe constitue des sequences nucleotidiques SEQ ID N° 
3, 5, 7, 9, 11, 13, 15, 17, 19,21,23,25, 28, 30, 34, 36, 40,43,45,47,49, 53,60, 62, 64, 
5 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 
147 et 149, ou Tun de ses variants ou l'une des sequences derivees de celles-ci en raison 
de la degenerescence du code genetique, ou un polynucleotide de sequence 
complementaire. Preferentiellement, ces dits polynucleotides sont isoles a partir d'une 
bacterie du genre Streptomyces, plus preferentiellement, ces polynucleotides codent des 

10 proteines impliquees dans la biosynthese d'un macrolide et encore plus 
preferentiellement, ces polynucleotides codent des proteines ayant des activites 
similaires aux proteines codees par les polynucleotides avec lesquels ils presentent 
l'identite. De fa?on tout a fait preferee, un polynucleotide selon l'invention est choisi 
dans le groupe constitue des sequences nucleotidiques SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 

15 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 
76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, ou un 
polynucleotide de sequence complementaire. 

L'alignement optimal des sequences pour la comparaison peut etre realise de 
maniere informatique a l'aide d'algorithmes connus, par exemple ceux du package 

20 FASTA (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France. A titre 
d'illustration, le pourcentage d'identite de sequence pourra etre determine a l'aide du 
logiciel LFASTA (Chao K.-M. et ah, 1992) ou LALIGN (Huang X. et Miller W., 1991). 
Les programmes LFASTA et LALIGN font partie du package FASTA. LALIGN 

25 retourne les alignements locaux optimaux : ce programme est plus rigoureux, mais aussi 
plus lent que LFASTA. 

Un autre aspect de l'invention concerne un polypeptide resultant de Texpression 
d'une sequence d'acide nucleique telle que definie ci-dessus. Preferentiellement, les 
polypeptides selon l'invention presentent au moins 70%, de fa?on plus preferee 80%, de 
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fa9on plus preferee 85%, de fafon encore plus preferee 90%, de fa<?on encore plus 
preferee 95% et de maniere tout a fait preferee 98% d'identite en acides amines avec un 
polypeptide comprenant au moins 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 
160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 
5 500, 520, 540, 560, 580, 600, 620 ou 640 acides amines consecutifs d'un polypeptide 
choisiparmi SEQIDN 0 4, 6, 8, 10, 12, 14, 16, 18,20, 22, 24, 26, 27, 29,31,32,33,35, 
37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 
73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 et 
150, ou l'une de ces sequences excepte que tout au long de ladite sequence un ou 

10 plusieurs acides amines ont ete substitues, inseres ou deletes sans en affecter les 
proprietes fonctionnelles ou Tun des variant de ces sequences. Preferentiellement les 
polypeptides selon l'invention sont exprimes a l'etat naturel par une bacterie du genre 
Streptomyces, plus preferentiellement, ces polypeptides sont impliques dans la 
biosynthese d'un macrolide et encore plus preferentiellement, ces polypeptides ont une 

15 activite similaire a celle du polypeptide avec lequel il partage l'identite. De fapon 
preferee, un polypeptide selon l'invention est choisi dans le groupe constitue des 
sequences polypeptidiques SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 
31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 
65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 

20 144, 146, 148 et 150, ou l'une de ces sequences excepte que tout au long de ladite 
sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes sans en 
affecter les proprietes fonctionnelles ou l'un des variant de ces sequences. De fa<?on tout 
a fait preferee, un polypeptide selon l'invention est choisi dans le groupe constitue des 
sequences polypeptidiques SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 

25 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 
65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 
144, 146, 148 et 150. 

L'alignement optimal des sequences pour la comparaison peut etre realise de 
maniere informatique a l'aide d'algorithmes connus, par exemple ceux du package 
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FASTA (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France. A titre 
d' illustration, le pourcentage d'identite de sequence pourra etre determine a Taide du 
logiciel LFASTA (Chao K.-M. et al, 1992) ou LALIGN (Huang X. et Miller W., 1991), 
5 en utilisant les parametres par defaut tel que defini par le centre de ressources 
INFOBIOGEN, Evry, France. Les programmes LFASTA et LALIGN font partie du 
package FASTA. LALIGN retourne les alignements locaux optimaux : ce programme 
est plus rigoureux, mais aussi plus lent que LFASTA. 

Un autre aspect de Pinvention concerne un ADN recombinant comprenant au 

10 moins un polynucleotide tel que decrit ci-dessus. Preferentiellement; cet ADN 
recombinant est un vecteur. Encore plus preferentiellement, le vecteur est choisi parmi 
les bacteriophages, les plasmides, les phagemides, les vecteurs integratifs, les fosmides, 
les cosmides, les vecteurs navettes, les BAC (Bacterial Artificial Chromosome) ou les 
PAC (PI -derived Artificial Chromosome). A titre illustratif on peut citer comme 

15 bacteriophages le phage lambda et le phage Ml 3. Comme plasmides on peut citer les 
plasmides se repliquant chez E. coli par exemple pBR322 et ses derives, pUC18 et ses 
derives, pUC19 et ses derives, pGB2 et ses derives (Churchward G. et al, 1984), 
pACYC177 (numero d'acces GenBank : X06402) et ses derives, pACYC184 (numero 
d'acces GenBank : X06403) et ses derives. On peut egalement citer les plasmides se 

20 repliquant chez Streptomyces comme par exemple pUlOl et ses derives, pSG5 et ses 
derives, SLP1 et ses derives, SCP2* et ses derives (Kieser et al 2000). Comme 
phagemides on peut citer a titre illustratif pBluescript II et ses derives (commercialises 
notamment par la societe Stratagene (LaJolla, Californie, USA)), pGEM-T et ses 
derives (commercialise par la societe Promega (Madison, Wisconcin, USA)), XZAPII et 

25 ses derives (commercialises notamment par la societe Stratagene (LaJolla, Californie, 
USA)). Comme vecteurs integratifs on peut citer a titre illustratif, les vecteurs 
integratifs chez Streptomyces comme par exemple ceux derives de SLP1 (Kieser et al, 
2000), ceux derives de pSAM2 (Kieser et al, 2000), les vecteurs utilisant les systemes 
d'integration des phages PhiC31 (Kieser et al, 2000) (par exemple pSET152 (Bierman 

30 et al., 1992)) ou de VWB (Van Mellaert L, et al 1998), ainsi que les vecteurs utilisant 



79 



le systeme d' integration de IS1 17 (Kieser et al. 2000). Comme fosmides on peut citer a 
titre illustratif le fosmide pFOSl (commercialise par la societe New England Bioloabs 
Inc., Beverly, Massachusetts, USA) et ses derives. Comme cosmides on peut citer a 
titre illustratif le cosmide SuperCos et ses derives (commercialises notamment par la 
5 societe Stratagene (LaJolla, Californie, USA)), le cosmide pWED15 (Wahl et al, 1987) 
et ses derives. Comme vecteurs navettes on peut citer a titre illustratif les plasmides 
navettes E. coli I Streptomyces comme par exemple pIJ903 et ses derives, la serie des 
plasmides pUWL, pCAO106, pWHM3, pOJ446 et leurs derives (Kieser et al 2000), les 
BAC navettes E. coli I Streptomyces comme par exemple ceux decrits dans la demande 

10 de brevet WO 01/40497. Comme BAC (Bacterial Artificial Chromosome) on peut citer 
a titre illustratif le BAC pBeloBACll (numero d'acces GenBank :U51113). Comme 
PAC (PI -derived Artificial Chromosome) on peut citer a titre illustratif le vecteur 
pCYPAC6 (numero d'acces GenBank : AF133437). De fa<?on tout a fait preferee, un 
vecteur selon I'invention est choisi parmi pOS49.1, pOS49.11, pOSC49.12, pOS49.14, 

15 pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67, 
pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, 
pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, 
pSPM509, pSPMl, pBXLllll, pBXL1112, pBXL1113, pSPM520, pSPM521, 
pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, 

20 pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, 
pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, pSPM51, pSPM52, pSPM53, 
pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74, 
pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 et pSPM106. 

Un autre aspect de I'invention concerne un systeme d'expression comprenant un 
25 vecteur d'expression approprie et une cellule hote permettant l'expression d'un ou 
plusieurs polypeptides tels que decrits ci-dessus dans un systeme biologique. Les 
vecteurs d'expression selon I'invention comprennent une sequence d'acide nucleique 
codant un ou plusieurs polypeptides tels que decrits ci-dessus et peuvent etre destines a 
l'expression des differents polypeptides selon I'invention dans diverses cellules hotes 
30 bien connues de l'homme du metier. A titre d'exemple, on peut citer les systemes 
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d'expression procaryote comme les systemes d'expression chez la bacterie E. coli, les 
sytemes d'expression eucaryotes, comme le systeme d'expression baculovirus 
permettant une expression dans des cellules d'insectes, les sytemes d'expression 
permettant une expression dans des cellules de levures, les sytemes d'expression 
5 permettant une expression dans des cellules de mammiferes, notamment des cellules 
humaines. Les vecteurs d'expression utilisables dans de tels systemes sont bien connus 
de l'homme du metier, en ce qui concerne les cellules procaryotes, on peut citer a titre 
illustratif les vecteurs d'expression chez E. coli par exemple, de la famille pET 
commercialises par la societe Stratagene (LaJolla, Californie, USA), les vecteurs de la 

10 famille GATEWAY commercialises par la societe Invitrogen (Carlsbad, Californie, 
USA), les vecteurs de la famille pBAD commercialises par la societe Invitrogen 
(Carlsbad, Californie, USA), les vecteurs de la famille pMAL commercialises par la 
societe New England Bioloabs Inc. (Beverly, Massachusetts, USA), les vecteurs 
d'expression inductibles par le rhamnose cites dans la publication Wilms B et al., 2001 

15 et leurs derives, on peut egalement citer les vecteurs d'expression chez Streptomyces 
comme par exemple les vecteurs pU4123, pIJ6021, pPM927, pANT849, pANT 850, 
pANT 851, pANT1200, pANT1201, pANT1202 et leurs derives (Kieser et al. y 2000). 
En ce qui concerne les cellules de levures, on peut citer a titre illustratif le vecteur pESC 
commercialise par la societe Stratagene (LaJolla, Californie, USA). En ce qui concerne 

20 le systeme d'expression baculovirus permettant une expression dans des cellules 
d'insectes on peut citer a titre illustratif le vecteur BacPAK6 commercialise par la 
societe BD Biosciences Clontech, (Palo Alto, Californie, USA). En ce qui concerne les 
cellules de mammiferes, on peut citer a titre illustratif des vecteurs comprenant le 
promoteur des genes precoces du virus CMV (Cytomegalovirus) (par exemple le 

25 vecteur pCMV et ses derives commercialises par la societe Stratagene (LaJolla, 
Californie, USA), ou le promoteur des genes immediats (SV40 early promoter) du virus 
simien vacuolisant SV40 (par exemple le vecteur pSG5 commercialise par la societe 
Stratagene (LaJolla, Californie, USA). 



L'invention est egalement relative a un procede de production d'un polypeptide 
30 tel que decrit ci-dessus ledit procede comprenant les etapes suivantes: 
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a) inserer un acide nucleique codant ledit polypeptide dans un vecteur approprie 

b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 
transformee ou transfectee avec le vecteur de 1'etape a) ; 

5 c) recuperer le milieu de culture conditionne ou un extrait cellulaire, par 

exemple par sonication ou par choc osmotique ; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Fextrait cellulaire obtenu a 1'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

10 Un polypeptide recombinant selon 1' invention peut etre purifie par passage sur 

une serie appropriee de colonnes de chromatographic, selon les methodes connues de 
Thomme de Tart et decrites par exemple dans F .Ausubel et al (2002). On peut citer a 
titre illustratif la technique du « Tag-Histidine », qui consiste a aj outer une courte 
sequence poly-histidine au polypeptide a produire, ce dernier pouvant ensuite etre 

15 purifie sur colonne de nickel. Un polypeptide selon Finvention peut etre egalement 
prepare par les techniques de synthese in vitro. A titre illustratif de telles techniques, un 
polypeptide selon Finvention pourra etre prepare grace au systeme « rapid translation 
system (RTS)», commercialise notamment par la societe Roche Diagnostics France S.A, 
Meylan, France. 

20 Un autre aspect de Finvention concerne des cellules hotes dans laquelle a ete 

introduit au moins un polynucleotide et/ou au moins un ADN recombinant et/ou au 
moins un vecteur d'expression selon Finvention. 

Un autre aspect de Finvention concerne des microorganismes bloques dans une 
etape de la voie de biosynthese d'au moins un macrolide. L'interet reside d'une part dans 
25 l'etude de la fonction des proteines mutees et d'autre part dans la realisation de 
microorganismes produisant des intermediaires de biosynthese. Ces intermediaires 
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peuvent etre modifies, eventuellement apres separation, soit par ajout de composants 
particuliers dans les milieux de production, soit par introduction dans les 
microorganismes ainsi mutes d'autres genes codant des proteines susceptibles de 
modifier l'intermediaire en s'en servant comme substrat. Ces intermediaires peuvent 
5 ainsi etre modifies par voie chimique, biochimique, enzymatique et/ou microbiologique. 
Les microorganismes bloques dans une etape de la voie de biosynthese de macrolides 
peuvent etre obtenus en inactivant la fonction d'une ou plusieurs proteines impliquees 
dans la biosynthese de ce ou de ces macrolides dans des microorganismes producteurs 
de ce ou de ces macrolide. Selon la ou les proteines inactivees, on pourra ainsi obtenir 

10 des microorganismes bloques dans les differentes etapes de la voie de biosynthese de ce 
ou de ces macrolides. L'inactivation de cette ou de ces proteines peut etre effectuee par 
toute methode connue de l'homme du metier, par exemple par mutagenese dans le ou 
les genes codant ladite ou lesdites proteines ou par l'expression d'un ou de plusieurs 
ARN anti-sens complementaires de TARN ou des ARN messagers codant ladite ou 

15 lesdites proteines. La mutagenese peut, par exemple, etre effectuee par irradiation, par 
action d'agent chimique mutagene, par mutagenese dirigee, par remplacement de gene 
ou toute autre methode connue de l'homme du metier. Les conditions convenables 
d'une telle mutagenese peuvent par exemple etre adaptees selon l'enseignement contenu 
dans les ouvrages de Kieser, T et al (2000) et Ausubel et al., (2002). La mutagenese 

20 peut etre effectuee in vitro ou in situ, par suppression, substitution, deletion et/ou 
addition d f une ou plusieurs bases dans le gene considere ou par inactivation genique. 
Cette mutagenese peut etre effectuee dans un gene comprenant une sequence telle que 
decrite ci-dessus. Preferentiellement, les microorganismes bloques dans une etape de la 
voie de biosynthese de macrolides sont des bacteries du genre Streptomyces. Plus 

25 preferentiellement, l'inactivation de la fonction d'une ou plusieurs proteines impliquees 
dans la biosynthese du ou des macrolides en question est effectuee par mutagenese. 
Encore plus preferentiellement, le macrolide en question est la spiramycine et les 
microorganismes dans lesquels sont effectuees la ou les mutageneses sont des souches 
de S. ambofaciens. Plus preferentiellement, la mutagenese est effectuee dans un ou 

30 plusieurs genes comprenant une des sequences correspondant a une ou plusieurs des 



sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 
118, 120, 141, 143, 145, 147 et 149. De fa9on preferee, la ou les mutageneses sont 
effectuees par inactivation genique. De fa<?on tout a fait preferee, la mutagenese consiste 
5 en Tinactivation genique d'un gene comprenant une sequence correspondant a la 
sequence SEQ ID N° 13. 

A titre illustratif, les microorganismes suivants peuvent etre cites a titre d'exemple 
de tels microorganismes : OS49.16 (or/3:; Ohyg, cf. exemple 2), OS49.67 (orf3 deletion 
en phase, cf. exemple <5), OS49.107 {orf8\: Ohyg, cf. exemple 7), OS49.50 

10 {orflO:: Ohyg, cf. exemple 8), SPM21 {prf2::att3Qaac-, cf. exemple 10), SPM22 
(prf2::att3 deletion en phase, cf. exemple 10), SPM501 (orf6*::attl &hyg±, cf. exemple 
14), SPM502 {prf6*::attl deletion en phase, cf. exemple 14), SPM507 
(orfl2::att3{2aac-> cf. exemple 11), SPM508 (prfl3c::att3Qaac- 9 cf. exemple 12), 
SPM509 (prfl4::att3Qaac^ cf. exemple 13), SPM107 (or/28c::att3aac+ 9 cf. exemple 

15 29), SPM543 (orf31::att3aac+ 9 cf. exemple 30), SPM106 (prf32c::att3aac+ 9 cf. 
exemple 31). 

Un autre aspect de Pinvention concerne un procede de preparation d'un 
intermediaire de biosynthese de macrolide utilisant les microorganismes bloques dans 
une etape de la voie de biosynthese de macrolides, tels que decrits ci-dessus. Le procede 

20 consiste a cultiver, dans un milieu de culture approprie, un microorganisme bloque dans 
une etape de la voie de biosynthese de macrolides, tels que decrits ci-dessus, recuperer 
le milieu de culture conditionne ou un extrait cellulaire, par exemple par sonication ou 
par choc osmotique, separer et purifier a partir dudit milieu de culture ou encore a partir 
de l'extrait cellulaire obtenu a l'etape precedente, ledit intermediaire de biosynthese. 

25 Les conditions de culture de tels microorganismes pourront etre determinees selon des 
techniques bien connues de l'homme du metier. Le milieu de culture pourra par 
exemple etre le milieu MPS ou le milieu SL11 pour les Streptomyces et notamment 
pour Streptomyces ambofaciens (Pernodet et al. 9 1993). L'homme du metier pourra 
notamment se referer a l'ouvrage de Kieser et al (2000) en ce qui concerne la culture 
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des Streptomyces. L'intermediaire produit peut etre recupere par toutes techniques 
connues de l'homme du metier. L'homme du metier pourra se referer, par exemple, aux 
techniques enseignees dans le brevet americain US 3,000,785 et plus particulierement 
aux methodes d'extraction des spiramycines decrites dans ce brevet. 

5 Un autre objet de l'invention concerne un procede de preparation d'une molecule 

derivee d'un macrolide utilisant les microorganismes bloques dans une etape de la voie 
de biosynthese de ce macrolide, tels que decrits ci-dessus. Le procede consiste a obtenir 
un intermediate de biosynthese selon le procede ci-dessus et a modifier l'intermediaire 
ainsi produit, eventuellement apres separation du milieu de culture. Les conditions de 

10 culture de tels microorganismes pourront etre determinees selon des techniques bien 
connues de l'homme du metier. Le milieu de culture pourra par exemple etre le milieu 
MPS ou le milieu SL11 pour les Streptomyces et notamment pour Streptomyces 
ambofaciens (Pernodet et al., 1993). L'homme du metier pourra notamment se referer a 
l'ouvrage de Kieser et al. 2000 en ce qui concerne la culture des Streptomyces. Les 

15 intermediates produits peuvent etre modifies, eventuellement apres separation, soit par 
ajout de composants appropries dans les milieux de production, soit par introduction 
dans les microorganismes d'autres genes codant des proteines susceptibles de modifier 
Tintermediaire en s'en servant comme substrat. Ces intermediates peuvent ainsi etre 
modifies par voie chimique, biochimique, enzymatique et/ou microbiologique. Plus 

20 preferentiellement, le macrolide en question est la spiramycine et les microorganismes 
dans lesquels sont effectuees la ou les mutageneses sont des souches de S. ambofaciens. 

L'invention est egalement relative a un microorganisme produisant de la 
spiramycine I mais ne produisant pas de spiramycine II et HI. Ce microorganisme 
comprend l'ensemble des genes necessaires a la biosynthese de la spiramycine I mais ne 
25 produit pas de spiramycine II et HI car le gene comprenant la sequence correspondant a 
SEQ ID N° 13 ou Tun de ses variants ou Tune des sequences derivees de celles-ci en 
raison de la degenerescence du code genetique et codant un polypeptide de sequence 
SEQ ID N° 14 ou Tun de ses variants n'est pas exprime ou a ete rendu inactif. 
L'inactivation de cette proteine peut etre effectuee par toute methode connue de 
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Thomme du metier, par exemple par mutagenese dans le gene codant ladite proteine ou 
par l'expression d'un ARN anti-sens complementaire de TARN messager codant ladite 
proteine, etant entendu que si l'expression de or/5* est affectee par cette manipulation, 
il sera necessaire de proceder a une autre modification pour que le gene orf5* soit 
5 correctement exprime. La mutagenese peut etre effectuee dans la sequence codante ou 
dans une sequence non codante de maniere a rendre inactive la proteine codee ou a en 
empecher son expression ou sa traduction. La mutagenese peut etre effectuee par 
mutagenese dirigee, par remplacement de gene ou toute autre methode connue de 
Thomme du metier. Les conditions convenables d'une telle mutagenese peuvent par 

10 exemple etre adaptees selon l'enseignement contenu dans les ouvrages de Kieser, T et 
al (2000) et Ausubel et al, 2002. La mutagenese peut etre effectuee in vitro ou in situ, 
par suppression, substitution, deletion et/ou addition d'une ou plusieurs bases dans le 
gene considere ou par inactivation genique. Le microorganisme peut etre egalement 
obtenu en exprimant les genes de la voie de biosynthese de la spiramycine sans que 

15 ceux-ci ne comprennent le gene comprenant la sequence SEQ ID N° 13 ou Tun de ses 
variants ou Tune des sequences derivees de celles-ci en raison de la degenerescence du 
code genetique et codant un polypeptide de sequence SEQ ID N° 14 ou Tun de ses 
variants. Preferentiellement, le microorganisme est une bacterie du genre Streptomyces. 
Plus preferentiellement, le microorganisme produisant de la spiramycine I mais ne 

20 produisant pas de spiramycine II et HI est obtenu a partir d'un microorganisme de depart 
produisant les spiramycines I, II et HI. Encore plus preferentiellement, le 
microorganisme est obtenu par mutagenese dans un gene comprenant la sequence 
correspondant a SEQ ID N° 13 ou l'un de ses variants ou Tune des sequences derivees 
de celles-ci en raison de la degenerescence du code genetique et codant un polypeptide 

25 de sequence SEQ ID N° 14 ou l'un de ses variants ayant la meme fonction. Encore plus 
preferentiellement, cette mutagenese est effectuee par inactivation genique. De maniere 
preferee le microorganisme est obtenu a partir d'une souche de S. ambofaciens 
produisant les spiramycines I, II et HI dans laquelle est effectuee une inactivation 
genique du gene comprenant la sequence correspondant a SEQ ID N° 13 ou l'une des 

30 sequences derivees de celle-ci en raison de la degenerescence du code genetique. De 
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maniere tout a fait preferee, l'inactivation genique est effectuee par deletion en phase du 
gene ou d'une partie du gene comprenant la sequence correspondant a SEQ ID N° 13 ou 
Tune des sequences derivees de celle-ci en raison de la degenerescence du code 
genetique. A titre illustratif, la souche SPM502 (orf6*::attl, cf. exemple 14) peut etre 
5 citee comme un microorganisme produisant de la spiramycine I mais ne produisant pas 
de spiramycine II et HI. 

L'invention est egalement relative a un microorganisme produisant de la 
spiramycine I mais ne produisant pas de spiramycine II et III tel que decrit ci-dessus 
caracterise en ce en ce qu'il surexprime en outre : 

10 - un gene susceptible d'etre obtenu par amplification en chaine par polymerase en 
utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou 1'ADN total de Streptomyces ambofaciens, plus 

15 preferentiellement il s'agit du gene de sequence codante SEQ ID N° 141, 

- ou un gene derive de ceux-ci en raison de la degenerescence du code genetique. 

Un exemple de sequence d'un tel gene est donne en SEQ ED N° 111 (ADN), cependant 
cette sequence est partielle puisqu'elle ne comprend pas la partie 3' de la sequence 
codante correspondante. La traduction en proteine de cette partie de sequence codante 

20 est donnee en SEQ ID N° 112. L'homme du metier pourra aisement la completer 
notamment en utilisant l'enseignement presente dans l'exemple 24. La sequence 
indeterminee dans SEQ ID N° 1 1 1 a ete determinee dans un second temps et la sequence 
complete de cette orf (orf28c) est donnee en SEQ ID N° 141. La traduction en proteine 
de cette sequence codante est donnee en SEQ ID N° 142. II est presente dans l'exemple 

25 24 une methode pour doner le gene orf28c et pour fabriquer un vecteur d'expression 
permettant l'expression de orf28c. II est egalement montre dans cet exemple que la 
surexpression du gene orf28c dans la souche OSC2 conduit a 1'amelioration de la 
production en spiramycines de cette souche. La surexpression du gene orf28c peut etre 
obtenue en augmentant le nombre de copies de ce gene et/ou en plagant un promoteur 
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plus actif que le promoteur sauvage. De fa<?on preferee, la surexpression dudit gene est 
obtenue en apportant dans le microorganisme une construction d'ADN recombinant, 
permettant la surexpression de ce gene. De fa<?on preferee, cette construction d'ADN 
recombinant augmente le nombre de copie dudit gene et permet d'obtenir une 
5 surexpression dudit gene. Dans cette construction d'ADN recombinant, la sequence 
codante du gene peut etre placee sous le controle d'un promoteur plus actif que le 
promoteur sauvage. On peut citer a titre d'illustration le promoteur ptrc actif chez 
Streptomyces ambofaciens (Amann, E. et al. 9 1988) ainsi que le promoteur ermE*. 
Ainsi, de fa?on preferee, la ou les copies du gene orf28c apportee sont placees sous le 
10 controle du promoteur ermE* comme c'est le cas dans la construction pSPM75 (cf. 
exemple 24). 

L'invention est egalement relative a un microorganisme produisant de la 
spiramycine I mais ne produisant pas de spiramycine II et EH tel que decrit ci-dessus 
caracterise en ce en ce qu'il surexprime en outre le gene de sequence codante SEQ ID 
15 N° 47 ou d'une sequence codante derivee de celle-ci en raison de la degenerescence du 
code genetique. Preferentiellement, ce microorganisme est caracterise en ce qu'il s'agit 
de la souche SPM502 pSPM525 deposee aupres de la Collection Nationale de Cultures 
de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris 
Cedex 15, France, le 26 fevrier 2003 sous le numero d'enregistrement 1-2977. 

20 L'invention est egalement relative a un procede de production de spiramycine I, le 

precede consiste a cultiver dans un milieu de culture approprie un microorganisme 
produisant de la spiramycine I mais ne produisant pas de spiramycine II et IQ tel que 
decrit ci-dessus, recuperer le milieu de culture conditionne ou un extrait cellulaire, 
separer et purifier a partir dudit milieu de culture ou encore a partir de 1' extrait 

25 cellulaire obtenu a l'etape precedente la spiramycine I. Les conditions de culture de tel 
microorganisme pourront etre determinees selon des techniques bien connues de 
l'homme du metier. Le milieu de culture pourra par exemple etre le milieu MP5 ou le 
milieu SL11 pour les Streptomyces et notamment pour Streptomyces ambofaciens 
(Pernodet et al. 9 1993). L'homme du metier pourra notamment se referer a l'ouvrage de 
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Kieser et al. 2000 en ce qui concerne la culture des Streptomyces. La spiramycine I 
produite peut etre recuperee par toutes techniques connues de l'homme du metier. 
L'homme du metier pourra se referer, par exemple, aux techniques enseignees dans le 
brevet americain US 3,000,785 et plus particulierement aux methodes d'extraction des 
5 spiramycines decrites dans ce brevet. 

Un autre aspect de T invention concerne T utilisation d'une sequence nucleotidique 
selon Tinvention pour ameliorer la production en macrolides d'un microorganisme. 
Ainsi, Tinvention concerne un microorganisme mutant producteur de macrolide 
caracterise en ce qu'il possede une modification genetique dans au moins un gene 

10 comprenant une sequence telle que definie ci-dessus et/ou qu'elle surexprime au moins 
un gene comprenant une sequence telle que definie ci-dessus. La modification genetique 
peut consister en une suppression, une substitution, une deletion et/ou une addition d f une 
ou plusieurs bases dans le ou les genes consideres dans le but d'exprimer une ou des 
proteines ayant une activite superieure ou d'exprimer un niveau plus eleve de cette ou de 

15 ces proteines. La surexpression du gene considere peut etre obtenue en augmentant le 
nombre de copies de ce gene et/ou en pla9ant un promoteur plus actif que le promoteur 
sauvage. On peut citer a titre d' illustration le promoteur ptrc actif chez Streptomyces 
ambofaciens (Amann, E. et al, 1988) ainsi que le promoteur ermE* (Bibb et al, 1985), 
(Bibb et al., 1994). Ainsi la surexpression du gene considere peut etre obtenue en 

20 apportant dans un microorganisme producteur du macrolide considere une construction 
d'ADN recombinant selon Tinvention, permettant la surexpression de ce gene. En effet, 
certaines etapes de la biosynthese des macrolides sont limitantes et si Ton exprime une 
ou plusieurs proteines plus actives ou un niveau d'expression plus important de la ou des 
proteines sauvages impliquees dans ces etapes limitantes, on peut ameliorer la 

25 production du ou des macrolides concernes. Une augmentation du taux de production de 
la tylosine a par exemple ete obtenue chez Streptomyces fradiae par duplication du gene 
codant une methyl transferase limitante convertissant la macrocine en tylosine (Baltz R, 
1997). L'obtention de Texpression d'une proteine plus active peut etre obtenue 
notamment par mutagenese, l'homme du metier pourra par exemple se referer a ce sujet 

30 a Touvrage de F.Ausubel et al (2002). Preferentiellement, ces microorganismes mutants 
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ameliores pour leur production en macrolides sont des bacteries du genre Streptomyces. 
Plus preferentiellement, le macrolide en question est la spiramycine et les 
microorganismes dans lesquels sont effectuees la ou les mutageneses sont des souches 
de S. ambofaciens. Plus preferentiellement, la modification genetique est effectuee dans 
5 un ou plusieurs genes comprenant une des sequences correspondant a une ou plusieurs 
des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 
118, 120, 141, 143, 145, 147 et 149, ou Tun de ses variants ou Tune des sequences 
derivees de celles-ci en raison de la degenerescence du code genetique. De fa?on 

10 preferee, le microorganisme surexprime un ou plusieurs genes comprenant une des 
sequences correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 
15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 
74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, ou 
Tun de ses variants ou Tune des sequences derivees de celles-ci en raison de la 

15 degenerescence du code genetique. De fa?on preferee, le microorganisme surexprime le 
gene comprenant une sequence correspondant a SEQ ID N° 111 ou 141, ou Tun de ses 
variants ou Tune des sequences derivees de celles-ci en raison de la degenerescence du 
code genetique. La sequence donnee en SEQ ID N° 111 est partielle, cependant 
Thomme du metier pourra aisement la completer notamment en utilisant l'enseignement 

20 presente dans l'exemple 24. La sequence indeterminee dans SEQ ID N° 111 a ete 
determinee dans un second temps et la sequence complete de cette orf {prf28c) est 
donnee en SEQ ED N° 141. La traduction en proteine de cette sequence codante est 
donnee en SEQ ED N° 142. II est ainsi presente l'exemple 24 une methode pour doner le 
gene orf28c et pour fabriquer un vecteur d'expression permettant l'expression de orf28c. 

25 II est egalement montre dans cet exemple que la surexpression du gene orf28c dans la 
souche OSC2 conduit a Amelioration de la production en spiramycines de cette souche. 
La surexpression du gene orf28c peut etre obtenue en augmentant le nombre de copies 
de ce gene et/ou en pla9ant un promoteur plus actif que le promoteur sauvage. De fagon 
preferee, la surexpression du gene orf28c est obtenue en apportant dans le 

30 microorganisme une construction d'ADN recombinant, permettant la surexpression de 
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ce gene. De fa9on preferee, cette construction d'ADN recombinant augmente le nombre 
de copie du gene orf28c et permet d'obtenir une surexpression du gene orf28c. Dans 
cette construction d'ADN recombinant, la sequence codante de orf28c peut etre placee 
sous le controle d'un promoteur plus actif que le promoteur sauvage. On peut citer a titre 
5 d'illustration le promoteur ptrc actif chez Streptomyces ambofaciens (Amann, E. et al., 
1988) ainsi que le promoteur ermE*. Ainsi, de fa<?on preferee, la ou les copies du gene 
orf28c apportee sont placees sous le controle du promoteur ermE* comme c'est le cas 
dans la construction pSPM75 (cf. exemple 24). 

Un autre aspect de Tinvention concerne un procede de production de macrolides 

10 utilisant les microorganismes decrits au paragraphe precedent. Ce procede consiste a 
cultiver dans un milieu de culture approprie un microorganisme defini dans le 
paragraphe precedent, recuperer le milieu de culture conditionne ou un extrait cellulaire, 
separer et purifier a partir dudit milieu de culture ou encore a partir de 1'extrait 
cellulaire obtenu a Tetape precedente le ou les macrolides produits. Les conditions de 

15 culture de tels microorganismes pourront etre determinees selon des techniques bien 
connues de Thomme du metier. Le milieu de culture pourra par exemple etre le milieu 
MPS ou le milieu SL11 pour les Streptomyces et notamment pour Streptomyces 
ambofaciens (Pernodet et al., 1993). L'homme du metier pourra notamment se referer a 
Touvrage de Kieser et al. 2000 en ce qui concerne la culture des Streptomyces. Le ou les 

20 macrolides produits peuvent etre recuperes par toutes techniques connues de Thomme 
du metier. L'homme du metier pourra se referer, par exemple, aux techniques 
enseignees dans le brevet americain US 3,000,785 et plus particulierement aux 
methodes d'extraction des spiramycines decrites dans ce brevet. Preferentiellement, les 
microorganismes utilises dans un tel procede sont des bacteries du genre Streptomyces. 

25 Plus preferentiellement, le macrolide en question est la spiramycine et les 
microorganismes mutants ameliores pour leur production en spiramycines sont des 
souches de S. ambofaciens. 

Un autre aspect de Tinvention concerne Tutilisation d'une sequence et/ou d'un 
vecteur selon Tinvention pour la preparation d'antibiotiques hybrides. En effet, les 
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polynucleotides selon l'invention peuvent servir a Fobtention de microorganismes 
exprimant une ou plusieurs proteines mutantes donnant lieu a une modification dans la 
specificite du substrat ou encore etre exprimes dans de multiples microorganismes 
producteurs d'antibiotiques dans le but de generer des antibiotiques hybrides. Ainsi les 
5 polynucleotides selon F invention peuvent permettre, par transfert des genes entre 
microorganismes producteurs, de fabriquer des antibiotiques hybrides ayant des 
proprietes pharmacologiquement interessantes (Hopwood et al, 1985a, Hopwood et 
aL, 1985b, Hutchinson et al, 1989). Le principe par lequel Fingenierie genetique peut 
conduire a la production d'antibiotiques hybrides a ete tout d'abord propose par 

10 Hopwood (Hopwood 1981). H a ainsi ete propose que les enzymes participant a la 
biosynthese d'antibiotiques acceptent souvent des substrats relies structurellement, mais 
differents de leur substrat naturel. II est generalement admis (Hopwood 1981, 
Hutchinson 1988, Robinson 1988) que les enzymes codees par les genes de la voie de 
biosynthese d'antibiotiques ont une specificite de substrat moins stricte que les enzymes 

15 du metabolisme primaire. II a ainsi pu etre montre qu'un grand nombre de substrats non- 
naturels sont transformes par des microorganismes producteurs d'antibiotique, leur 
mutants ou des enzymes purifiees de la voie de biosynthese de ces antibiotiques 
(Hutchinson 1988). En utilisant cet enseignement, Fhomme du metier pourra construire 
des microorganismes exprimant une ou plusieurs proteines mutantes donnant lieu a une 

20 modification dans la specificite du substrat dans le but de generer des antibiotiques 
hybrides. 

L'invention concerne egalement Futilisation d'au moins un polynucleotide et/ou 
au moins un ADN recombinant et/ou au moins un vecteur d'expression et/ou au moins 
un polypeptide et/ou au moins une cellule hote selon l'invention pour realiser une ou 

25 plusieurs bioconversions. Ainsi l'invention permet de construire des souches 
bacteriennes ou fongiques dans lesquelles on exprime, sous le controle de signaux 
d'expression appropries, une ou plusieurs proteines selon l'invention. De telles souches 
peuvent alors etre utilisees pour realiser une ou des bioconversions. Ces bioconversions 
peuvent se faire soit a Taide de cellules entieres, soit a l'aide d'extraits acellulaires des 

30 dites cellules. Ces bioconversions peuvent permettre de transformer une molecule en une 
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forme derivee, avec une enzyme d'une voie de biosynthese. Par exemple, Carreras et al. 
decrit l'utilisation de souche de Saccharopolyspora erythraea et de Streptomyces 
coelicolor pour la production de nouveau derives d'erithromycines (Carreras et al., 
2002). Walczar et al. decrit l'utilisation d'une P450 mono-oxygenase de Streptomyces 
5 pour la bioconversion de desacetyladriamycine (un analogue de ranthracycline) en de 
nouvelles anthracyclines (Walczar et al., 2001). Olonao et al. decrit l'utilisation d'une 
souche de Streptomyces lividans modifiee pour la bioconversion de rhodomycinone- 
epsilon en rhodomycine D (Olonao et al., 1999). L'homme du metier pourra appliquer 
ce principe a tout intermediate de biosynthese. 

10 L'invention concerne egalement un ADN recombinant caracterise en ce qu'il 

comprend : 

- un polynucleotide susceptible d'etre obtenu par amplification en chaine par 
polymerase en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 

15 GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, plus 
preferentiellement il s'agit d'un polynucleotide de sequence SEQ ID N° 141, 

- ou un fragment d'au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 
150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 

20 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 1480, 
1490 ou 1500 nucleotides consecutifs de ces polynucleotides. 

Preferentiellement; cet ADN recombinant est un vecteur. Encore plus 
preferentiellement, le vecteur est choisi parmi les bacteriophages, les plasmides, les 
phagemides, les vecteurs integratifs, les fosmides, les cosmides, les vecteurs navettes, 
25 les BAC (Bacterial Artificial Chromosome) ou les PAC (PI -derived Artificial 
Chromosome). A titre illustratif on peut citer comme bacteriophages le phage lambda 
et le phage Ml 3. Comme plasmides on peut citer les plasmides se repliquant chez E. 
coli par exemple pBR322 et ses derives, pUC18 et ses derives, pUC19 et ses derives, 
pGB2 et ses derives (Churchward G. et al, 1984), pACYC177 (numero d'acces 
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GenBank : X06402) et ses derives, pACYC184 (numero d'acces GenBank : X06403) 
et ses derives. On peut egalement citer les plasmides se repliquant chez Streptomyces 
comme par exemple pIJlOl et ses derives, pSG5 et ses derives, SLP1 et ses derives, 
SCP2* et ses derives (Kieser et al 2000). Comme phagemides on peut citer a titre 
5 illustratif pBluescript II et ses derives (commercialises notamment par la societe 
Stratagene (LaJolla, Californie, USA)), pGEM-T et ses derives (commercialise par la 
societe Promega (Madison, Wisconcin, USA)), XZAPII et ses derives 
(commercialises notamment par la societe Stratagene (LaJolla, Californie, USA)). 
Comme vecteurs integratifs on peut citer a titre illustratif, les vecteurs integratifs 

10 chez Streptomyces comme par exemple ceux derives de SLP1 (Kieser et al, 2000), 
ceux derives de pSAM2 (Kieser et al, 2000), les vecteurs utilisant les systemes 
d'integration des phages PhiC31 (Kieser et al, 2000) (par exemple pSET152 
(Bierman et al, 1992)) ou de VWB (Van Mellaert L, et al 1998), ainsi que les 
vecteurs utilisant le systeme d'integration de IS117 (Kieser et al. 2000). Comme 

15 fosmides on peut citer a titre illustratif le fosmide pFOSl (commercialise par la 
societe New England Bioloabs Inc., Beverly, Massachusetts, USA) et ses derives. 
Comme cosmides on peut citer a titre illustratif le cosmide SuperCos et ses derives 
(commercialises notamment par la societe Stratagene (LaJolla, Californie, USA)), le 
cosmide pWED15 (Wahl et al, 1987) et ses derives. Comme vecteurs navettes on 

20 peut citer a titre illustratif les plasmides navettes E. coli I Streptomyces comme par 
exemple pIJ903 et ses derives, la serie des plasmides pUWL, pCAO106, pWHM3, 
pOJ446 et leurs derives (Kieser et al 2000), les BAC navettes E. coli I Streptomyces 
comme par exemple ceux decrits dans la demande de brevet WO 01/40497. Comme 
BAC (Bacterial Artificial Chromosome) on peut citer a titre illustratif le BAC 

25 pBeloBACll (numero d'acces GenBank :U51 113). Comme PAC (Pl-derived 
Artificial Chromosome) on peut citer a titre illustratif le vecteur pCYPAC6 (numero 
d'acces GenBank : AF 133437). Plus preferentiellement, cet ADN recombinant est un 
vecteur d'expression. Les vecteurs d'expression utilisables dans differents systemes 
d'expression sont bien connus de 1'homme du metier, en ce qui concerne les cellules 

30 procaryotes, on peut citer a titre illustratif les vecteurs d'expression chez E. coli par 
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exemple, de la famille pET commercialises par la societe Stratagene (LaJolla, 
Californie, USA), les vecteurs de la famille GATEWAY commercialises par la 
societe Invitrogen (Carlsbad, Californie, USA), les vecteurs de la famille pBAD 
commercialises par la societe Invitrogen (Carlsbad, Californie, USA), les vecteurs de 
5 la famille pMAL commercialises par la societe New England Bioloabs Inc. (Beverly, 
Massachusetts, USA), les vecteurs d'expression inductibles par le rhamnose cites 
dans la publication Wilms B et aL 9 2001 et leurs derives, on peut egalement citer les 
vecteurs d'expression chez Streptomyces comme par exemple les vecteurs pIJ4123, 
pIJ6021, pPM927, pANT849, pANT 850, pANT 851, pANT1200, pANT1201, 

10 pANT1202 et leurs derives (Kieser et al. 9 2000). En ce qui concerne les cellules de 
levures, on peut citer a titre illustratif le vecteur pESC commercialise par la societe 
Stratagene (LaJolla, Californie, USA). En ce qui concerne le systeme d'expression 
baculovirus permettant une expression dans des cellules d'insectes on peut citer a titre 
illustratif le vecteur BacPAK6 commercialise par la societe BD Biosciences 

15 Clontech, (Palo Alto, Californie, USA). En ce qui concerne les cellules de 
mammiferes, on peut citer a titre illustratif des vecteurs comprenant le promoteur des 
genes precoces du virus CMV (Cytomegalovirus) (par exemple le vecteur pCMV et 
ses derives commercialises par la societe Stratagene (LaJolla, Californie, USA), ou le 
promoteur des genes immediats (SV40 early promoter) du virus simien vacuolisant 

20 S V40 (par exemple le vecteur pSG5 commercialise par la societe Stratagene (LaJolla, 
Californie, USA). Un autre aspect de l'invention concerne des cellules hotes dans 
laquelle a ete introduit au moins un ADN recombinant decrit dans ce paragraphe. 

Un autre aspect de l'invention concerne un procede de production d'un 
polypeptide caracterise en ce que ledit procede comprend les etapes suivantes: 
25 a) transformer une cellule hote par au moins un vecteur d'expression tel que 

decrit dans le paragraphe ci-dessus; 

b) cultiver, dans un milieu de culture approprie, ladite cellule hote; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
30 l'extrait cellulaire obtenu a 1'etape c), ledit polypeptide ; 
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e) le cas echeant, caracteriser le polypeptide recombinant produit. 

Le polypeptide recombinant ainsi produit peut etre purifie par passage sur une 
serie appropriee de colonnes de chromatographic, selon les methodes connues de 
Thomme de Tart et decrites par exemple dans F. Ausubel et al (2002). On peut citer a 
5 titre illustratif la technique du « Tag-Histidine », qui consiste a ajouter une courte 
sequence poly-histidine au polypeptide a produire, ce dernier pouvant ensuite etre 
purifie sur colonne de nickel. Ce polypeptide peut egalement etre prepare par les 
techniques de synthese in vitro. A titre illustratif de telles techniques, le polypeptide 
pourra etre prepare grace au systeme « rapid translation system (RTS)», commercialise 
10 notamment par la societe Roche Diagnostics France S.A, Meylan, France. 

Un autre aspect de l'invention concerne un microorganisme producteur d'au 
moins une spiramycine caracterise en ce qu'il surexprime : 

-un gene susceptible d'etre obtenu par amplification en chaine par polymerase (PCR) en 
utilisant le couple d'amorces de sequence suivante : 5' 

15 AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3 5 (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, plus 
preferentiellement il s'agit du gene de sequence codante SEQ ID N° 141, 
- ou un gene derive de ceux-ci en raison de la degenerescence du code genetique. 

20 Un exemple de sequence d'un tel gene est donne en SEQ ED N° 111 (ADN), cependant 
cette sequence est partielle puisqu'elle ne comprend pas la partie 3' de la sequence 
codante correspondante. La traduction en proteine de cette partie de sequence codante 
est donnee en SEQ ED N° 112. L'homme du metier pourra aisement la completer 
notamment en utilisant l'enseignement presente dans l'exemple 24. II est ainsi presente 

25 dans cet exemple une methode pour doner le gene orf28c et pour fabriquer un vecteur 
d'expression permettant l'expression de or/28c. II est egalement montre dans cet 
exemple que la surexpression du gene orf28c dans la souche OSC2 conduit a 
Amelioration de la production en spiramycines de cette souche. De fa?on preferee, le 
microorganisme surexprimant 
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- un gene susceptible d'etre obtenu par amplification en chaine par polymerase (PCR) en 
utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 

5 matrice le cosmide pSPM36 ou PADN total de Streptomyces ambofaciens, plus 
preferentiellement il s'agit du gene de sequence codante SEQ ID N° 141, 

- ou un gene derive de celui-ci en raison de la degenerescence du code genetique 

est une bacterie du genre Streptomyces, de maniere encore plus preferee, il s'agit d'une 
bacterie de l'espece Streptomyces ambofaciens. De fa?on preferee, la surexpression 

10 dudit gene est obtenue par transformation dudit microorganisme par un vecteur 
d'expression, de maniere tout a fait prefere, la souche de microorganisme est la souche 
OSC2/pSPM75(l) ou de la souche OSC2/pSPM75(2) deposee aupres de la Collection 
Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur 
Roux 75724 Paris Cedex 15, France, le 6 octobre 2003 sous le numero d'enregistrement 

15 1-3101. 

Un autre aspect de T invention concerne un procede de production de 
spiramycine(s) utilisant les microorganismes decrits au paragraphe precedent. Ce 
procede consiste a cultiver dans un milieu de culture approprie un microorganisme 
defini dans le paragraphe precedent, recuperer le milieu de culture conditionne ou un 

20 extrait cellulaire, separer et purifier a partir dudit milieu de culture ou encore a partir de 
1'extrait cellulaire obtenu a l'etape precedente le ou les spiramycines produites. Les 
conditions de culture de tels microorganismes pourront etre determinees selon des 
techniques bien connues de l'homme du metier. Le milieu de culture pourra par 
exemple etre le milieu MP5 ou le milieu SL1 1 pour les Streptomyces et notamment 

25 pour Streptomyces ambofaciens (Pernodet et al., 1993). L'homme du metier pourra 
notamment se referer a l'ouvrage de Kieser et al. 2000 en ce qui concerne la culture des 
Streptomyces. Le ou les spiramycines produites peuvent etre recuperes par toutes 
techniques connues de l'homme du metier. L'homme du metier pourra se referer, par 
exemple, aux techniques enseignees dans le brevet americain US 3,000,785 et plus 

30 particulierement aux methodes d'extraction des spiramycines decrites dans ce brevet. 
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Preferentiellement, les microorganismes utilises dans un tel procede sont des bacteries 
du genre Streptomyces. Plus preferentiellement, les microorganismes sont des souches 
de S. ambofaciens. 

Un autre aspect de l'invention concerne un vecteur d'expression caracterise 
5 en ce que le polynucleotide de sequence SEQ ID N° 47 ou un polynucleotide derive 
de celui-ci en raison de la degenerescence du code genetique est place sous le 
controle d'un promoteur permettant l'expression de la proteine codee par le dit 
polynucleotide chez Streptomyces ambofaciens. Des exemples de vecteurs 
d'expression utilisables chez Streptomyces ont ete donnes ci-dessus. 
10 Preferentiellement un tel vecteur d'expression est caracterise en ce qu'il s'agit du 
plasmide pSPM524 ou pSPM525. 

Un autre aspect de Tinvention concerne une souche de Streptomyces 
ambofaciens transformee par un vecteur defini dans le paragraphe precedent. 

Un autre aspect de Tinvention concerne un polypeptide caracterise en ce que 
15 sa sequence comprend la sequence SEQ ID N° 112. L'invention est egalement 
relative a un polypeptide caracterise en ce que sa sequence correspond a la sequence 
traduite de la sequence codante : 

- d'un gene susceptible d'etre obtenu par amplification en chaine par 
polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
20 AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, plus 
preferentiellement il s'agit du gene de sequence codante SEQ ID N° 141, 

-ou d'un gene derive de celui-ci en raison de la degenerescence du code 
25 genetique. 

Preferentiellement ces polypeptides sont exprimes a l'etat naturel par une bacterie du 
genre Streptomyces, plus preferentiellement, ces polypeptides sont impliques dans la 
biosynthese des spiramycines. 
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Un autre aspect de Finvention concerne un vecteur d'expression permettant 
l'expression d'un polypeptide tel que defini dans le paragraphe precedent chez 
Streptomyces ambofaciens. Des exemples de vecteurs d'expression utilisables chez 
Streptomyces ont ete donnes ci-dessus. Preferentiellemnt, le vecteur d'expression en 
5 question est le plasmide pSPM75. 

LISTE DES FIGURES 

Figure 1 : Structure chimique des spiramycines I, II et HI. 
Figure 2 : Cosmides utilises pour le sequen9age de la region. 

Figure 3 : Organisation d'un groupe de genes impliques dans la voie de biosynthese des 
10 spiramycines. 

Figure 4 : Voie de biosynthese proposee du mycarose. 
Figure 5 : Voie de biosynthese proposee du mycaminose. 
Figure 6 : Voie de biosynthese proposee de la forosamine. 

Figure 7 : Ordre preferentiel d'ajout des sucres dans la molecule de spiramycine et 
15 intermediaries. 

Figure 8 : Voie de biosynthese proposee du methoxymalonyl chez S. ambofaciens. Cette 
voie est proposee par analogie avec la biosynthese du methoxymalonyl chez 
Streptomyces hygroscopicus van ascomyceticus (Wu,K. et ah, 2000). 
Figure 9 : Etapes conduisant a l'inactivation d'un gene: 
20 A) Clonage du gene cible dans un vecteur se repliquant chez E. coli mais pas 

chez Streptomyces^ 

B) Insertion de la cassette de resistance dans le gene cible (par clonage ou 
recombinaison entre courtes sequences identiques); 

C) Introduction du plasmide chez Streptomyces ambofaciens (par 
25 transformation ou conjugaison avec E. coli) et selection des clones ayant integre 

la cassette puis criblage de clones ayant perdu la partie vecteur pour avoir un 
remplacement de gene; 

D) Region du chromosome de la souche mutante dans laquelle le gene cible est 
inactive par remplacement de gene. 
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Figure 10 : Etapes optionnelles suivant l'inactivation d'un gene selon la methode decrite 
en figure 9, pouvant etre conduites si une cassette excisable a ete employee pour 
interrompre le gene cible : 

E) Introduction dans la souche mutante du plasmide pOSV508 portant les genes 
5 xis et int de pSAM2 dont les produits vont permettre Texcision efficace par 

recombinaison specifique de sites entre les sequences attL et attR bordant la 
cassette; 

F) Obtention de clones ayant perdu la cassette excisable et sensibles a 
l'antibiotique a laquelle la cassette conferait la resistance; 

10 G) Apres croissance et sporulation sur milieu solide sans antibiotique le 

plasmide pOSV508 est perdu a haute frequence. On peut ainsi obtenir des clones 
sensibles au thiostrepton dans lesquels le gene cible contient une deletion en 
phase. La sequence du gene cible delete peut etre controlee par amplification 
PCR et sequen?age du produit PCR. 

15 Figure 1 1 : Amplification de la cassette excisable dans le but de l'utiliser pour une 
experience de recombinaison homologue. La technique de recombinaison homologue 
grace a de courtes sequences homologues a ete decrite par (Chaveroche et aL, 2000). Les 
39 ou 40 deoxy-nucleotides situes a 1'extremite 5' de ces oligonucleotides comportent 
une sequence correspondant a une sequence du gene a inactiver et les 20 deoxy- 

20 nucleotides situes le plus en 3* correspondent a la sequence d'une des extremites de la 
cassette excisable. 

Figure 12 : Obtention d'une construction pour l'inactivation d'un gene cible grace a la 
technique decrite par (Chaveroche et al., 2000). 

Figure 13 : Carte du plasmide pWHM3. Strepto ori : origine de replication 
25 Streptomyces. 

Figure 14 : Carte du plasmide pOSV508. 

Figure 15 : Exemple de structure d'une cassette excisable. Celle-ci est constituee de la 
cassette Qhyg (Blondelet-Rouault et al. 9 1997) bordee des sites attR et attL (Raynal et 
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al., 1998), entre lesquels un evenement de recombinaison permettra l'excision de la 
cassette, grace a T expression des genes xis et int. 
Figure 16 : Carte du plasmide pBXLl 111. 
Figure 17 : Carte du plasmide pBXLl 1 12. 
5 Figure 18 : Test microbiologique de production de spiramycine, base sur la sensibilite 
d'une souche de Micrococcus luteus a la spiramycine. La souche de Micrococcus luteus 
utilisee est une souche naturellement sensible a la spiramycine mais resistante a la 
congocidine. Les differentes souches de Streptomyces a tester ont ete cultivees en 
erlenmeyers de 500 ml contenant 70 ml de milieu MPS, inocules a une concentration 

10 initiale de 2.5 10 6 spores/ml et mises a pousser a 27°C sous agitation orbitale de 250 
rpm. Des prelevements de mouts de fermentation ont ete realises apres 48, 72 et 96 
heures de culture et centrifuges. Une dilution au dixieme de ces surnageants dans du 
milieu de culture sterile est utilisee pour le test. La souche indicatrice de Micrococcus 
luteus resistante a la congocidine mais sensible a la spiramycine (Gourmelen et aL, 

15 1998) a ete cultivee dans une boite carree de 12x12 cm. Des disques en papier Whatman 
AA ont ete imbibes de 70 jil de la dilution au dixieme de chaque surnageant et deposes 
sur la surface de la boite. Des disques imbibes d'une solution de spiramycine de 
differentes concentrations (2-4-8 jig/ml dans du milieu de culture MPS) sont utilises 
comme gamme etalon. Les boites sont incubees a 37°C pendant 24 a 48h. Si le disque 

20 contient de la spiramycine, celle-ci diffuse dans l'agar et inhibe la croissance de la 
souche indicatrice de Micrococcus luteus. Cette inhibition cree un « halo » autour du 
disque, ce halo refletant la zone ou la souche de Micrococcus luteus n'a pas pousse. La 
presence de ce halo est done une indication de la presence de spiramycine et permet de 
determiner si la souche de S. ambofaciens en question est productrice ou non productrice 

25 de spiramycine. Une comparaison avec les diametres d'inhibition obtenus pour la 
gamme etalon permet d'obtenir une indication de la quantite de spiramycine produite par 
cette souche. 

Figure 19 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche OSC2. 
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Figure 20 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM501. 

Figure 21 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM502. 

5 Figure 22 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM507. 

Figure 23 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
souche SPM508. 

Figure 24 : Chromatogramme CLHP du surnageant filtre du milieu de culture de la 
10 souche SPM509. 

Figure 25 : Alignement de la proteine Orf3 (SEQ ID N° 29) avec la proteine TylB (SEQ 
ID N° 87) de S.fradiae realise grace au programme FASTA. 

Figure 26 : Alignement de la proteine MdmA de S. mycarofaciens (SEQ ID N° 88) avec 
la proteine SrmD (SEQ ID N° 16) realise grace au programme FASTA. 

15 Figure 27 : Exemple de sequences des sites residuels apres excision de la cassette 
excisable. En gras est indique le site att26 minimum tel que defini dans Raynal et aL, 
1998. La sequence de la phase 1 (attl) de 33 nucleotides est presentee en SEQ ED N° 
104, la sequence de la phase 2 (att2) de 34 nucleotides est presentee en SEQ ID N° 105, 
la sequence de la phase 3 (att3) de 35 nucleotides est presentee en SEQ ID N° 95. Figure 

20 28 : Representation schematique du gene orflO, localisation des amorces PCR utlisees 
et construction obtenue avec chaque couple d'amorces. 
Figure 29 : Construction de la cassette pac-oritT. 
Figure 30 : Carte du cosmide pWED2. 

Figure 31 : Representation schematique du groupe de genes impliques dans la voie de 
25 biosynthese des spiramycines et de la localisation des trois sondes utilisees pour isoler 
les cosmides de la banque d'ADN genomique de la souche OSC2 de Streptomyces 
ambofaciens chez E. coli (cf. exemple 19). Figure 32 : Localisation des inserts des 
cosmides isoles de la banque d'ADN genomique de la souche OSC2 de Streptomyces 
ambofaciens chezE. coli (cf. exemple 19). 
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Nouvelle banque d' ADN cosmidique. Figure 33 : Sous clonage du fragment Pstl-Pstl du 
cosmide pSPM36 (insert du plasmide (pSPM58), sous clonage du fragment Stul-StuI du 
cosmide pSPM36 (insert du plasmide pSPM72) et sous clonage d'un fragment EcoRl- 
Stul (insert du plasmide pSPM73). 
5 Figure 34 : Localisation des phases ouvertes de lecture indentifiees dans l'insert Pstl- 
Pstl du plasmide pSPM58 et dans l'insert EcoRl-Stul du plasmide pSPM73. 
Figure 35 : Superposition des chromatogrammes CLHP du surnageant filtre du milieu 
de culture de la souche OS49.67 realises a 238 et 280nm (haut) et spectres UV des 
molecules elues a 33,4 minutes et 44,8 minutes (bas). 
10 Figure 36 : Structure moleculaire des molecules platenolide A et platenolide B. 

Figure 37 : Organisation du groupe de genes impliques dans la voie de biosynthese des 
spiramycines. 

Figure 38 : Structure moleculaire d'un intermediaire de biosynthsee produit par la 
souche SPM507. 

15 Figure 39 : Structure d'un intermediaire de biosynthsese produit par une souche de S. 
ambofaciens de genotype orf6*::attlQhyg+ obtenue a partir d'une souche 
surproduisant les spiramycines. L'insertion de la cassette attlQhyg+ dans orf6* exerce 
un effet polaire empechant l'expression de or/5*. 

Figure 40 : Structure moleculaire des molecules platenolide A + mycarose et platenolide 
20 B + mycarose produites par la souche OS49.67 

Figure 41 : Sous clonage d'un fragment Pstl-Pstl du cosmide pSPM36 (insert du 
plasmide (pSPM79)), localisation des phases ouvertes de lecture indentifiees dans 
l'insert Pstl-Pstl du plasmide pSPM79 et localisation de la sequence SEQ ID N° 140. 



103 



La presente invention est illustree a l'aide des exemples qui suivent, qui doivent 
etre consideres comme illustratifs et non limitatifs. 

En resume, les genes de la voie de biosynthese des spiramycines ont ete isoles a 
partir d'une banque d f ADN genomique de Streptomyces ambofaciens. Cette banque a ete 
5 obtenue par digestion partielle de TADN genomique de Streptomyces ambofaciens, par 
l'enzyme de restriction BamHl. De larges fragments d'ADN, de 35 a 45 kb en moyenne, 
ont ete clones dans le cosmide pWEDl (Gourmelen et al, 1998) derive du cosmide 
pWED15 (Wahl et al., 1987). Ces cosmides ont ete introduits chez E. coli grace a des 
particules phagiques. La banque ainsi obtenue a ete hybridee avec une sonde (de 

10 sequence SEQ ID N° 86) correspondant a une partie du gene tylB de S. fradiae (Merson- 
Davies & Cundliffe, 1994, numero d'acces GenBank : U08223). Apres hybridation, un 
cosmide sur les 4 s'hybridant avec la sonde a ete plus particulierement selectionne. Ce 
cosmide nomme pOS49.1 a ensuite ete digere par Sacl et un fragment de 3,3 kb 
contenant la region s'hybridant avec la sonde a ete sous clone dans le vecteur pUC19 et 

15 sequence. Quatre phases ouvertes de lectures ont ete identifiees et Tune d'entre elles 
code une proteine (SEQ ID N° 29) presentant de fortes similitudes de sequence avec la 
proteine TylB de S fradiae (SEQ ID N° 87) (cf. figure 25). Ce gene a ete nomme orf3 
(SEQ ID N° 28) et a ete inactive chez S. ambofaciens. II a pu etre demontre que les 
clones inactives dans le gene or/3 ne produisent plus de spiramycines. Ceci montre 

20 Timplication du gene or/3 ou de genes situes en aval dans la biosynthese des 
spiramycines. 

Une fois cette confirmation obtenue, une plus grande region du cosmide pOS49.1 
a ete sequencee, de part et d'autre du fragment Sacl precedemment etudie. Ainsi, a partir 
du cosmide pOS49.1, la sequence d'une region comportant sept phases ouvertes de 
25 lecture entieres et deux autres incompletes, situees de part et d'autre de ces sept phases 
ouvertes completes, a pu etre obtenue. Grace a une recherche dans les bases de donnees, 
il a pu etre montre que l'une des phases ouvertes de lecture incomplete correspondait au 
locus srmG (region codant une enzyme appelee «polyketide synthase » (PKS)). Les 
genes correspondants ont ete clones par Burgett S. et al en 1996 (Brevet americain US 
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5,945,320). Par ailleurs, les autres phases ouvertes de lecture, les sept ORFs entieres 
nominees : orfl, orfl, or/3, orf4, or/5, orf6, orf7 (SEQ ID N° 23, 25, 28, 30, 34, 36, 40) 
et le debut de la huitieme ORF nomme or/S (sequence SEQ ED N° 43) n'ont pas ete 
retrouvees dans les bases de donnees. 

5 Dans un deuxieme temps et dans le but de doner d'autres genes impliques dans 

la biosynthese des spiramycines, d'autres cosmides comportant des fragments du genome 
de S. ambofaciens dans cette meme region ont ete isoles. Pour cela une nouvelle serie 
d'hybridations sur colonies a ete effectuee en utilisant trois sondes. La premiere sonde 
correspond a un fragment d'ADN de 3,7kb contenant orfl, orfl et le debut de or/3, sous 

10 clone a partir de pOS49. 1 . La deuxieme sonde correspond a un fragment de 2 kb d'ADN 
contenant une partie de orf7 et une partie de orf8 et sous clone a partir de pOS49.1. Une 
troisieme sonde a egalement ete utilisee. Cette derniere correspond a un fragment d'ADN 
de 1.8 kb contenant le gene srmD. Le gene srmD est un gene isole de S. ambofaciens 
capable de conferer la resistance a la spiramycine. En effet, des travaux anterieurs 

15 avaient permis le clonage de plusieurs determinants de resistance de S. ambofaciens, 
conferant la resistance a la spiramycine a une souche de S. griseofuscus (souche sensible 
a la spiramycine) (Pernodet et al., 1993) (Pernodet et al., 1999). Pour l'isolement de 
genes de resistances, une banque cosmidique de TADN genomique de la souche S. 
ambofaciens avait ete realisee dans le cosmide pKC505 (Richardson MA et al., 1987). 

20 Ce pool de cosmides avait ete introduit chez S. griseofuscus, naturellement sensible a la 
spiramycine. Cinq cosmides capables de conferer la resistance a Tapramycine et la 
spiramycine chez S. griseofuscus avaient ainsi ete obtenus. Parmi ces 5 cosmides, un 
cosmide nomme pOS44.1 possede dans son insert le gene srmD qui code une proteine 
presentant une certaine similitude avec la proteine codee par le gene mdmA de 

25 Streptomyces mycarofaciens et impliquee dans la resistance a la midecamycine chez cet 
organisme producteur (Hara et al., 1990, numero d'acces Genbank : A60725) (figure 
26). La troisieme sonde utilisee pour localiser les genes de biosynthese de spiramycine a 
ete un insert d'environ 1 .8kb comprenant le gene srmD. 
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Ces trois sondes ont ete utilisees pour hybrider la banque d'ADN genomique 
decrite ci-dessus et ont permis de choisir deux cosmides (pSPM7 et pSPM5) 
susceptibles de contenir les inserts les plus longs et n'ayant pas de bandes communes. Le 
cosmide pSMP5 hybridait avec la premiere et la deuxieme sonde, mais n'hybridait pas 
5 avec la troisieme sonde, alors que le cosmide pSPM7 hybridait avec la troisieme sonde 
seulement. Ces deux cosmides ont ete sequences en totalite par la technique du 
sequencage en aveugle (« shotgun sequencing »). Les sequences des inserts de ces deux 
cosmides : pSPM7 et pSPM5 ont pu etre assemblies car bien que ne se chevauchant pas, 
chacun des inserts comprenait une sequence connue a l'une de ses extremites. En effet, 

10 chacun de ces inserts comportait un fragment de la sequence d'un des genes codant une 
enzyme appelee « polyketide synthase » (PKS). Ces 5 genes ont ete clones par Burgett S. 
et al. en 1996 (Brevet americain US 5,945,320) (cf. figure 2). Ainsi, il a pu etre 
determine une sequence unique d'ADN genomique de S. ambofaciens. Une sequence de 
30943 nucleotides partant, en 5', d'un site EccRl situe dans le premier gene PKS et 

15 allant jusqu'a un site BamHl en 3' est presentee en SEQ ED N° 1. Cette sequence 
correspond a la region amont des genes de la PKS (cf. figure 2 et 3). Une deuxieme 
region de 1 1 171 nucleotides, partant d'un site Pstl en 5' et allant jusqu'a un site BstEU 
en 3' situe dans le cinquieme gene de la PKS est presentee en SEQ ID N° 2. Cette region 
est la region aval des genes de la PKS (l'aval et l'amont etant definis par Forientation 

20 des 5 genes de PKS tous orientes dans le meme sens) (cf. figures 2 et 3). 



Dans un troisieme temps et dans le but de doner d'autres genes impliques dans la 
biosynthese des spiramycines, d'autres cosmides comportant des fragments du genome 
de S. ambofaciens dans cette meme region ont ete isoles (cf. exemple 18 et 19). 
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EXEMPLE 1 : Construction d'une banque d'ADN genomique de la souche 
ATCC23877 de Streptomyces ambofaciens chez E. coli 

1.1. Extraction de TADN genomique de la souche ATCC23877 de Streptomyces 
ambofaciens. 

5 La souche ATCC23877 de Streptomyces ambofaciens (accessible notamment 

aupres de l'American Type Culture Collection (ATCC) (Manassas, Virginie, USA), sous 
le numero 23877) a ete cultivee en milieu YEME (Yeast Extract-Malt Extract) ((Kieser, 
T, et a/.,2000) et 1'ADN genomique de cette souche a ete extrait et purifie selon les 
techniques standards de lyse et precipitation (Kieser T. et al. 9 2000). 

10 1.2. Construction de la banque d'ADN genomique 

L'ADN genomique de la souche ATCC23877 de Streptomyces ambofaciens tel 
qu'isole ci-dessus a ete digere partiellement par Tenzyme de restriction BamHl de 
maniere a obtenir des fragments d'ADN de taille comprise entre environ 35 et 45 kb. 
Ces fragments ont ete clones dans le cosmide pWEDl (Gourmelen et aL, 1998) digere 

15 au prealable par BamHl. Le cosmide pWEDl est derive du cosmide pWE15 (Wahl, et 
aL, 1987) par deletion du fragment Hpal-Hpal de 4.1 kb contenant le module 
d'expression actif chez les mammiferes (Gourmelen et al. 9 1998). Le melange de 
ligation a ensuite ete encapside in vitro dans des particules de phages lambda grace au 
systeme « Packagene® Lambda DNA packaging system » commercialise par la societe 

20 Promega en suivant les recommandations du fabriquant. Les particules phagiques 
obtenues ont ete utilisees pour infecter la souche SURE® d'is. coli commercialisee par 
la societe Stratagene (LaJolla, Californie, USA). La selection des clones a ete effectuee 
sur milieu LB + ampicilline (50 jug/ml) puisque le cosmide pWEDl confere la resistance 
a Fampicilline. 

25 
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EXEMPLE 2 : Isolement et caracterisation de genes impliques dans la biosynthese 
de spiramycines chez Streptomyces ambofaciens 

2.1 Hybridation sur colonie des clones d'E. coli de la banque genomique de 
Streptomyces ambofaciens ATCC23877 

5 Environ 2000 clones d'£. coli de la banque obtenue ci-dessus, ont ete transferes 

sur filtre pour hybridation sur colonies. La sonde utilisee pour l'hybridation est un 
fragment Nael-Nael d'ADN (SEQ ID N° 86) comportant une partie du gene tylB de 
Streptomyces fradiae. Ce fragment correspond aux nucleotides 2663 a 3702 du fragment 
d'ADN decrit par Merson-Davies, L.A. & Cundliffe E. (Merson-Davies, L.A. & 
10 Cundliffe E., 1994, numero d'acces GenBank : U08223), dans lequel la sequence 
codante du gene tylB correspond aux nucleotides 2677 a 3843. 

Le fragment Nael-Nael d f ADN portant une partie du gene tylB de Streptomyces 
fradiae (SEQ ID N° 86) a ete marquee au 32 P par la technique du « random priming » 
(Kit commercialise par la societe Roche) et utilise comme sonde pour l'hybridation des 

15 2000 clones de la banque, transferes sur filtre. Les membranes utilisees sont des 
membranes nylon Hybond N commercialisees par la societe Amersham (Amersham 
Biosciences, Orsay, France) et l'hybridation a ete effectuee a 55°C dans le tampon decrit 
par Church & Gilbert (Church & Gilbert, 1984). Un lavage a ete effectue en 2X SSC a 
55°C pendant 15 minutes et deux lavages successifs en 0.5X SSC ont ensuite ete 

20 effectues a 55°C, d'une duree de 15 minutes chacun. Dans ces conditions d'hybridation 
et de lavage, 4 clones parmi les 2000 hybrides presentaient un fort signal d'hybridation. 
Ces 4 clones ont ete cultives en milieu LB+ ampicilline (50 /xg/ml) et les 4 cosmides 
correspondants ont ete extraits par lyse alcaline standard (Sambrook et al. 9 1989). II a 
ensuite ete verifie que l'hybridation etait bien due a un fragment d'ADN present dans 

25 l'insert de ces quatre cosmides. Pour cela, les cosmides ont ete digeres independamment 
par plusieurs enzymes (BamHl, Pstl et SacI). Les produits de digestions ont ete separes 
sur gel d'agarose, transferes sur membrane Nylon et hybrides par le fragment Nael-Nael 
d'ADN comportant une partie du gene tylB de Streptomyces fradiae (cf. ci-dessus) dans 
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les memes conditions que ci-dessus. Les quatres cosmides ont pu etre valides et un de 
ces cosmides a ete plus particulierement retenu et a ete nomme pOS49.1. 

2.2 Verification de l'implication de la region identifiee et sequencage de l'insert du 
cosmide pOS49.1 

5 Plusieurs fragments de l'insert du cosmide pOS49.1 ont ete sous-clones et leurs 

sequences ont ete determinees. Le cosmide pOS49.1 a ete digere par l'enzyme Sad et il 
a ete montre par Southern blot, dans les conditions decrites precedemment, qu'un 
fragment de 3,3 kb contient la region s'hybridant avec la sonde tylB. Ce fragment de 3,3 
kb a ete isole par electroelution a partir d'un gel d'agarose 0.8% puis clone dans le 

10 vecteur pUC19 (numero d'acces GenBank M77789) et sequence. Le plasmide ainsi 
obtenu a ete nomme pOS49.11. Quatre phases ouvertes de lecture presentant un usage 
des codons typique de Streptomyces ont pu etre identifies dans ce fragment (deux 
completes et deux tronquees), grace au programme FramePlot (Ishikawa J & Hotta K. 
1999). Des comparaisons de sequences grace au programme FASTA (cf.. (Pearson W. R 

15 & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible notamment aupres du centre 
de ressources INFOBIOGEN, Evry, France) ont permis de montrer que la proteine 
deduite de Tune de ces 4 phases ouvertes de lecture presente de fortes similitudes de 
sequence avec la proteine TylB (SEQ ID N° 87; Numero d'acces GenBank : U08223) de 
S.fradiae (cf. figure 25). Cette proteine a ete nommee Orf3 (SEQ ID N° 29). 

20 Dans le but de tester si le gene correspondant (le gene or/3 (SEQ ED N° 28)) etait 

implique dans la biosynthese des spiramycines chez S. ambofaciens, ce gene a ete 
interrompu par une cassette Hhyg (Blondelet-Rouault M-H. et ah, 1997, numero d'acces 
GenBank : X99315). Pour cela, le plasmide pOS49.1 1 a ete digere par l'enzyme Xhol et 
le fragment contenant les quatre phases ouvertes de lecture (deux completes et deux 

25 tronquees, dont orf3 en entier) a ete sous-clone au niveau du site Xhol du vecteur pBC 
SK+ commercialise par la societe Stratagene (LaJolla, Califormie, USA). Le plasmide 
ainsi obtenu a ete nomme pOS49.12. Dans le but d'inactiver or/3, un fragment PmR- 
BstEU interne a or/3 a ete remplace par la cassette Hhyg par clonage bout franc dans ce 
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dernier plasmide. Pour cela, le plasmide pOS49.12 a ete digere par les enzymes Pmtl et 
BstER dont le site unique se trouve dans la sequence codante du gene orf3. Les 
extremites du fragment correspondant au vecteur ont ete rendues bouts francs par un 
traitement par 1' enzyme de Klenow (grand fragment de la DNA polymerase I). La 
5 cassette Qhyg a ete obtenue par digestion par l'enzyme BamHI du plasmide pHP45 
Qhyg (Blondelet-Rouault et aL, 1997, numero d'acces GenBank : X99315). Le fragment 
correspondant a la cassette Qhyg a ete recupere sur gel d'agarose et ses extremites ont 
ete rendues bouts francs par un traitement par l'enzyme de Klenow. Les deux fragments 
bouts francs ainsi obtenus (la cassette Qhyg et le plasmide pOS49.12) ont ete ligues et le 
10 produit de ligation a ete utilise pour la transformation de bacteries E. coli. Le plasmide 
ainsi obtenu a ete nomme pOS49.14 et contient le gene orf3 interrompu par la cassette 
Qhyg. 

L'insert du plasmide pOS49.14, sous la forme d'un fragment Xhol-Xhol dont les 
extremites ont ete rendues non cohesives par un traitement par Tenzyme de Klenow, a 

15 ete clone au niveau du site EcoRV du plasmide pOJ260 (le plasmide pOJ260 est un 
plasmide conjugatif capable de se repliquer chez E. coli mais incapable de se repliquer 
chez S. ambofaciens (Bierman M et aL, 1992). Ce plasmide confere la resistance a 
Tapramycine chez E. coli et Streptomyces). Le plasmide obtenu (insert du plasmide 
pOS49.14 clone dans le plasmide pOJ260) a ete nomme pOS49.16. Ce dernier a ete 

20 transfere dans la souche ATCC23877 de S. ambofaciens par conjugaison a l'aide de la 
souche conjugative E. coli SI 7-1, comme decrit par Mazodier et al. (Mazodier et aL, 
1989). La souche E. coli SI 7-1 est derivee de la souche E. coli 294 (Simon et aL, 1983) 
(Simon, et aL, 1986). Des clones transconjugants possedant le marqueur de resistance a 
lTiygromycine porte par la cassette Qhyg et ayant perdu le marqueur de resistance a 

25 l'apramycine porte par le vecteur pOJ260 ont pu etre obtenus. Pour cela, apres 
conjugaison, les clones sont selectionnes pour leur resistance a Thygromycine. Les 
clones resistants a Fhygromycine sont ensuite repiques respectivement sur milieu avec 
hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A) (cf. figure 
9). Les clones resistants a 1'hygromycine (HygR) et sensibles a l'apramycine (ApraS) 

30 sont en principe ceux ou un double evenement de recombinaison s'est produit et qui 



110 



possedent done le gene or/3 interrompu par la cassette Qhyg. Le remplacement de la 
copie sauvage de or/3 par la copie interrompue a ete verifie par deux hybridations 
successives. Ainsi, l'ADN total des clones obtenus, a ete digere par differentes enzymes, 
separe sur gel d'agarose, transfere sur membrane et hybride avec une sonde 
5 correspondant a la cassette Qhyg (cf. ci-dessus)) pour verifier la presence de la cassette 
dans FADN genomique des clones obtenus. Une deuxieme hybridation a ete effectuee 
en utilisant comme sonde V insert Xhol-Xhol du plasmide pOS49.1 1 contenant les quatre 
phases ouvertes de lecture (deux completes et deux tronquees, dont or/3 en entier). La 
verification du genotype peut egalement etre realisee par toute methode connue de 
10 Fhomme du metier et notamment par PCR en utilisant les oligonucleotides appropries et 
sequen9age du produit de PCR. Un des clones or/3:: £2hyg ainsi obtenu et dont le 
genotype a ete verifie, a ete choisi et a ete appele OS49.16. 

La production en spiramycine du clone OS49.16 ainsi obtenu a ete testee grace au 
test de production decrit plus bas (cf. exemple 15). II a ainsi pu etre demontre que cette 
15 souche ne produit plus de spiramycine, confirmant l'implication de or/3 et/ou des genes 
situes en aval comme par exemple orf4 dans la biosynthese des spiramycines. 

Une fois cette confirmation obtenue, une plus grande region du cosmide pOS49.1 
a ete sequencee, de part et d f autre du fragment Sad precedemment etudie. Ainsi, a partir 
du cosmide pOS49.1, la sequence d'une region comportant sept phases ouvertes de 

20 lecture entieres et deux autres incompletes, situees de part et d'autre de ces sept phases 
ouvertes completes, a pu etre obtenue. Grace a une recherche dans les bases de donnees, 
il a pu etre montre que Tune des phases ouvertes de lecture incomplete correspondait au 
locus srmG (region codant une enzyme appelee « polyketide synthase » (PKS)). Les 
genes correspondants ont ete clones par Burgett S. et al. en 1996 (Brevet americain US 

25 5,945,320). Par ailleurs, les autres phases ouvertes de lecture: les sept ORFs entieres 
nominees : orfl, orf2, orfi, orf4, orf5, orf6, or/7 (SEQ ID N° 23, 25, 28, 30, 34, 36 et 
40) et le debut de la huitieme ORF nommee or/8 (la sequence entiere de cette orf est 
donnee en SEQ ID N° 43) n'ont pas ete retrouvees dans les bases de donnees. 
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EXEMPLE 3 : Isolement et caracterisation d'autres genes impliques dans la 
biosynthese de spiramycines chez Streptomyces ambofaciens 

Dans un deuxieme temps et dans le but de doner d'autres genes impliques dans la 
biosynthese des spiramycines, d'autres cosmides comportant des fragments du genome 
5 de S. ambofaciens dans cette meme region ont ete isoles. Pour cela il a ete procede a une 
nouvelle serie d ? hybridations sur colonies en utilisant trois sondes : 

- La premiere sonde utilisee correspond a un fragment d'ADN BamHl-Pstl de 3,7kb 
contenant un fragment du gene de la PKS (Les genes correspondant a la PKS ont ete 
clones par Burgett S. et al. en 1996 (Brevet americain US 5,945,320)), orfl, or/2 et le 
10 debut de or/3, sous clone a partir de pOS49.1 et allant d'un site BamHl situe 1300 paires 
de bases en amont du site EcoRl definissant la position 1 de SEQ ID N° 1, jusqu'au site 
Pstl situe en position 2472 (SEQ ID N° 1). Ce fragment BamHl-Pstl a ete sous clone a 
partir de pOS49.1 dans le plasmide pBC SK+, ce qui a permis d'obtenir le plasmide 
pOS49.28. 

15 - La deuxieme sonde utilisee correspond a un fragment d f ADN Pstl-BamRI d'environ 
2kb contenant un fragment &orf7 et d'orfS, sous clone a partir de pOS49. 1 et allant d'un 
site Pstl situe en position 6693 de SEQ ID N° 1 jusqu'au site BamHl situe en position 
8714 de SEQ ID N° 1. Ce fragment Pstl-BamHl a ete sous clone a partir de pOS49.1 
dans le plamside pBC SK+, ce qui a permis d'obtenir le plasmide pOS49.76. 

20 - Une troisieme sonde a egalement ete utilisee. Cette derniere correspond a un 

fragment d'ADN de 1.8kb EcoRl-HindUl contenant le gene srmD. Le gene srmD est un 
gene isole de 5. ambofaciens capable de conferer la resistance a la spiramycine. En effet, 
des travaux anterieurs avaient permis le clonage de plusieurs determinants de resistance 
de S. ambofaciens, conferant la resistance a la spiramycine a une souche de & 

25 griseofuscus (souche sensible a la spiramycine) (Pernodet et al, 1993) (Pernodet et al., 
1999). Pour isoler des genes de resistance, une banque cosmidique de TADN genomique 
de la souche S. ambofaciens ATCC23877 avait ete realisee dans le cosmide pKC505 
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(Richardson MA et al, 1987). Pour cela l'ADN genomique de la souche S. ambofaciens 
ATCC23877 avait ete digere partiellement par Sau3Al de maniere a obtenir des 
fragments de taille comprise entre environ 30 et 40 kb. L'ADN genomique ainsi digere 
(3p,g) avait ete ligue avec l^g du pKC505 prealablement digere par l'enzyme BamUl 
5 (Pernodet et al. 9 1999). Le melange de ligation avait ensuite ete encapside in vitro dans 
des particules phagiques. Les particules phagiques obtenues avaient ete utilisees pour 
infecter la souche d'E. coli HB101 (accessible notamment aupres de l'American Type 
Culture Collection (ATCC) (Manassas, Virginie, USA), sous le numero 33694). Environ 
20 000 clones d'E. coli resistant a l'apramycine avaient ete pooles et les cosmides de ces 

10 clones avaient ete extraits. Ce pool de cosmides avait ete introduit par transformation de 
protoplastes dans la souche DSM 10191 de S. griseofuscus (Cox KL & Baltz RH. 1984), 
naturellement sensible a la spiramycine (Rao RN et al. 9 1987, cette souche est disponible 
notamment aupres de la German Collection of Microorganisms and Cell Cultures 
(Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, DSMZ), 

15 (Braunschweig, Allamagne), sous le numero DSM 10191). Les transformants avaient ete 
selectionnes sur un milieu contenant de l'apramycine. 1300 des clones poussant sur 
milieu contenant de l'apramycine avaient ete transferes sur milieu contenant 5|ig/ml de 
spiramycine. Plusieurs clones resistants a l'apramycine avaient egalement pousse sur 
milieu contenant de la spiramycine et les cosmides de ces colonies avaient ete extraits et 

20 utilises pour transformer E. coli et S. griseofuscus (Pernodet et al., 1999). Cinq cosmides 
capables de conferer la resistance a l'apramycine a E. coli et la co-resistance a 
l'apramycine et la spiramycine chez S. griseofuscus avaient ainsi ete obtenus. Parmi ces 
5 cosmides, il a ete determine qu'un cosmide nomme pOS44.1 possede dans son insert 
un gene (SEQ ID N° 15) qui code une proteine (SEQ ID N° 16) presentant une certaine 

25 similitude avec une proteine codee par le gene mdmA de Streptomyces mycarofaciens 
(SEQ ID N° 88), ce gene a ete nomme srmD (cf. alignement presente en figure 26 realise 
grace au programme FASTA (cf . (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. 
R., 1990), accessibles notamment aupres du centre de ressources INFOBIOGEN, Evry, 
France). 
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Pour isoler le determinant de resistance contenu dans le plasmide pOS44.1, celui- 
ci a ete digere partiellement par Tenzyme de restriction Sau3Al de maniere a obtenir des 
fragments de taille d'environ 1,5 a 3 kb, ces fragments ont ete ligues dans le vecteur 
pIJ486 linearise par l'enzyme BamBl (Ward et al, 1986). Un plasmide a ete selectionne 
5 pour sa capacite a conferer la resistance a la spiramycine chez la souche DSM 10191 de 
S. griseofuscus (Rao RN et aL, 1987), naturellement sensible a la spiramycine (cf. ci- 
dessus). Pour cela, le pool de plasmides correspondant aux fragment Sau3A\ de pOS44.1 
ligues dans le vecteur pIJ486 (cf. ci-dessus), a ete introduit par transformation de 
protoplastes dans la souche DSM 10191 et les transformants ont ete selectionnes pour 

10 leur resistance au thiostrepton (due au gene tsr porte par pLT486). Les clones poussant 
sur milieu contenant du thiostrepton ont ete transferes sur milieu contenant de la 
spiramycine. Plusieurs clones resistants au thiostrepton ont egalement pousse sur milieu 
contenant de la spiramycine et les plasmides de ces colonies ont ete extraits. Un 
plasmide conferant la resistance et contenant un insert d'environ 1.8kb a ete selectionne 

15 et nomme pOS44.2. Cet insert de 1.8kb peut etre sorti facilement grace a un site HindUl 
et un site EcoTtl presents dans le vecteur de part et d'autre de Finsert. Cet insert de 1 .8kb 
HindUl-EcoKl a ete sequence et le gene de resistance qu'il renferme a ete nomme srmD. 
Ce fragment contenant le gene srmD a ainsi pu etre facilement sous-clone dans le 
vecteur pUC19 (numero d'acces GenBank M77789) ouvert par EcoJU-HindlH, le 

20 plasmide obtenu a ete nomme pOS44.4. L'insert de L8kb HindHI-EcoKL, contenant le 
gene srmD, de ce plasmide a ete utilise comme sonde pour localiser les genes de 
biosynthese de spiramycine (cf. ci-dessous). 

Un echantillon d'une souche Escherichia Coli DH5a contenant le plasmide 
pOS44.4 a ete depose aupres de la Collection Nationale de Cultures de Microorganismes 
25 (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 15, France, le 10 
juillet 2002 sous le numero d'enregistrement 1-2918. 



Environ 2000 clones de la banque, obtenus ci-dessus (cf. exemple 1), ont ete 
transferes sur filtre pour hybridation sur colonies selon les techniques classiques 
(Sambrook et al, 1989). 
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Les trois sondes decrites ci-dessus ont ete marquees au P par la technique du « 
random priming » (Kit commercialise par Roche) et utilisees pour 1 'hybridation des 
2000 clones de la banque, transferes sur filtre. L'hybridation a ete effectuee a 65°C dans 
le tampon decrit par Church & Gilbert (Church & Gilbert, 1984). Un lavage a ete 
5 effectue en 2X SSC a 65°C pendant 15 minutes et deux lavages successifs ont ensuite 
ete effectues en 0.5X SSC a 65°C, d'une duree de 15 minutes chacun. Dans ces 
conditions d'hybridation et de lavage, 16 clones parmi les 2000 hybrides presentaient un 
fort signal d'hybridation avec au moins une des sondes. Cependant, aucun cosmide 
n'hybridait avec les trois sondes. Les 16 cosmides ont ete extraits et digeres par 

10 1' enzyme de restriction BamHl. La comparaison des profils de restriction de ces 
differents cosmides entre eux, a conduit a choisir deux cosmides susceptibles de contenir 
les inserts les plus longs de la region et n'ayant pas de bandes communes. Ainsi deux 
cosmides Tun nomme pSPM5 et l'autre pSPM7 ont ete choisis. Le cosmide pSPM5 
hybridait avec les sondes orfl a orf4 et la sonde orf8, mais n'hybridait pas avec la sonde 

15 srmD. pSPM7 hybridait seulement avec la sonde srmD et pas avec les deux autres 
sondes. 

Ces deux cosmides ont ete sequences en totalite par la technique du sequen?age en 
aveugle (« shotgun sequencing »). Les sequences des inserts de ces deux cosmides : 
pSPM7 et pSPM5 ont pu etre assemblies car bien que ne se chevauchant pas, chacun 

20 des inserts comprenait une sequence connue a l'une de ses extremites. En effet, chacun 
de ces inserts comportait un fragment de la sequence d'un des genes codant une enzyme 
appelee «polyketide synthase » (PKS). Ces 5 genes ont ete clones par Burgett S. et al. 
en 1996 (Brevet americain US 5,945,320) (cf. figure 2). Ainsi, il a pu etre determine une 
sequence unique d'ADN genomique de S. ambofaciens. Une sequence de 30943 

25 nucleotides partant en 5' d'un site EcoRI situe dans le premier gene PKS et allant 
jusqu'a un site BamHl en 3' est presentee en SEQ ID N° 1. Cette sequence correspond a 
la region amont des genes de la PKS (cf. figure 2 et 3). Une deuxieme region de 11171 
nucleotides, partant d'un site Pstl en 5' et allant jusqu'a un site Ncol en 3' situe dans le 
cinquieme gene de la PKS est presentee en SEQ ID N° 2. Cette deuxieme region est la 
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region aval des genes de la PKS (l'aval et l'amont etant defini par l'orientation des 5 
genes de PKS tous orientes dans le meme sens) (cf. figure 2 et 3). 

EXEMPLE 4 : Analyse des sequences nucleotidiques, determination des phases 
ouvertes de lecture et caracterisation des genes impliques dans la biosynthese des 
5 spiramycines. 

Les sequences obtenues ont ete analysees grace au programme FramePlot 
(Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, parmi les phases ouvertes de 
lecture, les phases ouvertes de lecture presentant un usage des codons typique de 
Streptomyces. Cette analyse a permis de determiner que cette region comporte 35 ORFs 

10 localisees de part et d'autre de cinq genes codant l'enzyme «polyketide synthase » 
(PKS). Respectivement 10 et 25 ORFs ont ete identifies en aval et en amont de ces 
genes (l'aval et l'amont etant defini par l'orientation des 5 genes de PKS tous orientes 
dans le meme sens) (cf. figure 3). Ainsi, les 25 phases ouvertes de lecture de ce type, 
occupant une region d'environ 31 kb (SEQ ID N° 1 et figure 3) ont ete identifies en 

15 amont des 5 genes codant la PKS et 10 occupant une region d'environ 11,1 kb (SEQ ID 
N° 2 et figure 3), ont ete identifies en aval des genes de la PELS. Les genes de la region 
amont ont ete nommes orfl, orfl, or/3, orfl, orfl, orf6, orfl, orfl, orflc, orflO, orfllc, 
orfl 2, orfl 3c, orfl 4, orfl 5c, orfl 6, orfl 7, orfl 8, orfl 9, or/20, orfllc, orfllc, orf23c, 
orf24c et orflSc (SEQ ID N° 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 

20 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84). Les genes de la region aval ont ete nommes 
orfl*c, orfl*c, orfl*c, orf4*c, orfl*, orf6* orfl*c, orfl*, orfl*, orflO* (SEQ ID N° 3, 
5, 7, 9, 11, 13, 15, 17, 19 et 21). Le « c » ajoute dans le nom du gene signifiant pour 
l'ORF en question que la sequence codante est dans l'orientation inverse (le brin codant 
est done le brin complementaire de la sequence donnee en SEQ ID N° 1 ou SEQ ID N° 2 

25 pour ces genes) (cf. figure 3). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
comparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et al. 9 1990) (Altschul et aL, 1997), CD-search, COGs 
(Cluster of Orthologous Groups) (ces trois programmes sont accessibles notamment 
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aupres du National Center for Biotechnology Information (NCBI) (Bethesda, Maryland, 
USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), 
BEAUTY (Worley K. C. et al., 1995)), (ces deux programmes sont accessibles 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
5 comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycine. 

EXEMPLE 5 : Inactivation de gene : principe de la construction d'une souche de 
Streptomyces ambofaciens interrompue 

10 Les methodes utilisees consistent a effectuer un remplacement de gene. Le gene cible 
a interrompre est remplace par une copie de ce gene interrompue par une cassette 
conferant la resistance a un antibiotique (par exemple Tapramycine ou Thygromycine), 
comme l'illustre la figure 9. Les cassettes utilisees sont bordees de part et d'autre par des 
codons de terminaison de la traduction dans toutes les phases de lecture et par des 

15 terminateurs de transcription actifs chez Streptomyces. 

^insertion de la cassette dans le gene cible peut s'accompagner ou non d ! une deletion 
dans ce gene cible. La taille des regions flanquant la cassette peut aller de quelques 
centaines a plusieurs milliers de paires de bases. 

Les constructions necessaires a 1' inactivation du gene par la cassette ont ete obtenues 
20 chez E. coli, organisme de reference pour 1'obtention de constructions d'ADN 
recombinant. Le gene interrompu a ete obtenu dans un plasmide se repliquant chez E. 
coli mais ne pouvant pas se repliquer chez Streptomyces. 

Les constructions ont ensuite ete sous-clonees dans des vecteurs pour permettre la 
transformation et l'inactivation du gene voulu chez S. ambofaciens. Pour cela, deux 
25 plasmides ont ete utilises : 

- pOJ260 (Bierman M. et al. 9 1992) (cf. exemple 2) qui confere la resistance a 
Tapramycine chez E. coli et Streptomyces et qui a ete employe quand le gene cible 
a ete interrompu par une cassette conferant la resistance a Thygromycine. 
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pOSK1205 (4726pb). Ce plasmide derive du plasmide pBK-CMV (commercialise 
par la societe Stratagene (LaJolla, Californie, USA)) dans lequel un fragment 
Avrll contenant la sequence codant la resistance a la Neomycine/Kanamycine a 
ete remplace par une sequence codant la resistance a l'hygromycine, tout en 
conservant le promoteur P SV40. Pour cela, le plasmide pHP45-Q hyg (Blondelet- 
Rouault et al. 9 1997) a ete digere par les enzymes Notl et Pflml et le fragment 
conferant la resistance a l'hygromycine a ete sous-clone au niveau du site Avrll du 
vecteur pBK-CMV apres que toutes les extremites aient ete rendues bout franc 
par traitement a 1'enzyme de Klenow. Dans pOSK1205, la cassette qui confere la 
resistance a Thygromycine est precedee du promoteur pSV40. Ce plasmide 
confere la resistance a l'hygromycine chez E. coli et Streptomyces et a ete 
employe quand le gene cible a ete interrompu par une cassette conferant la 
resistance a Fapramycine. 

Les cassettes ont ete introduces dans le gene cible soit par clonage en utilisant des 
15 sites de restriction presents dans le gene cible, soit par recombinaison entre de courtes 
sequences identiques comme decrit par exemple par Chaveroche et al (Chaveroche MK 
et al. 9 2000). 

Le plasmide portant le gene interrompu par la cassette peut ensuite etre introduit chez 
Streptomyces ambofaciens, par exemple par conjugaison entre E. coli et Streptomyces 

20 (Mazodier P, et al, 1989). Cette technique a ete utilisee dans le cas ou le vecteur de base 
est le vecteur pOJ260. Une deuxieme technique peut etre utilisee : la technique de la 
transformation de protoplastes apres denaturation par traitement alcalin de TADN 
(Kieser, T et al, 2000), pour augmenter la frequence de recombinaison comme decrit 
par exemple par Oh & Chater (Oh & Chater, 1997). Cette technique a ete utilisee dans le 

25 cas ou le vecteur de base est pOJ260 ou pOSK1205 (cf. ci-dessous). Les transformants 
sont ensuite selectionnes avec l'antibiotique correspondant a la cassette presente dans le 
gene cible (cf. figure 9, antibiotique B). On selectionne ainsi un melange de clones 
parmi lesquels il y a eu integration par un seul ou par deux evenements de 
recombinaison. Dans un deuxieme temps on recherche les clones sensibles a 
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Tantibiotique pour lequel le gene de resistance est present dans le vecteur (hors de la 
cassette de recombinaison) (cf. figure 9, antibiotique A). On peut ainsi selectionner les 
clones pour lesquels il y a eu en principe deux evenements de recombinaison aboutissant 
au remplacement du gene sauvage par la copie interrompue par la cassette. Ces etapes 
5 sont schematises figure 9. 

Plusieurs cassettes peuvent etre utilisees pour Interruption des genes cibles. On peut 
par exemple utiliser la cassette Qhyg qui confere la resistance a l'hygromycine 
(Blondelet-Rouault et al. 9 1997, numero d'acces GenBank : X99315). 



10 EXEMPLE 6 : Construction d'une souche de Streptomyces ambofaciens 
interrompue en phase dans le gene or/3 

Le gene orf 3 avait ete interrompu par la cassette Qhyg (cf. exemple 2.2) et il a pu 
etre demontre qu'une souche orf3\\ Qhyg ne produit plus de spiramycine, confirmant 
l'implication d'un ou plusieurs genes de la region clonee dans la biosynthese des 

15 spiramycines (cf. exemple 2.2). Au vu de leur orientation, une cotranscription des ORFs 
1 a 7 est probable (cf. figure 3) et le phenotype observe (non producteur de 
spiramycines) peut etre du a Tinactivation d'un ou plusieurs des genes co-transcrits avec 
or/3. Pour confirmer l'implication de or/3 dans la biosynthese de spiramycines, une 
nouvelle inactivation du gene orf3 a ete effectuee, cette derniere etant realisee en phase. 

20 Pour cela, un fragment DraTR interne a or/3 de 504 paires de bases a ete delete. Un 
fragment d'ADN obtenu a partir de pOS49.1, allant du site EcoBl situe en position 1 
(SEQ ID N° 1) jusqu'au site Sad situe en position 5274 (SEQ ID N° 1) et qui comporte 
une deletion entre les deux sites DraUl aux positions 2563 et 3067 (504 nucleotides 
retires) a ete clone dans le plasmide pOJ260 (Bierman M. et al., 1992). Le plasmide 

25 ainsi obtenu a ete nomme pOS49.67. 

L'insert de pOS49.67 est done constitue par un fragment d'ADN de 5. ambofaciens 
contenant les genes orfl, orft, or/3 avec la deletion en phase, orf4 et une partie de or/5. 
Le vecteur dans lequel cet insert a ete sous-clone est pOJ260, le plasmide pOS49.67 
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confere done la resistance a Tapramycine et a ete introduit par transformation de 
protoplastes dans la souche OS49.16 (cf. exemple 2). La souche OS49.16 etant resistante 
a l'hygromycine, des transformants hygR et apraR ont ete obtenus. Apres deux passages 
de tels clones sur milieu non selectif, les clones sensibles a l'apramycine et a 
5 Thygromycine (apraS et hygS) ont ete recherches. Dans certains de ces clones, on 
s'attend en effet a ce qu'un evenement de recombinaison entre sequences homologues 
conduise au remplacement de la copie de or/3 interrompue par la cassette Dhyg (contenu 
dans le genome de la souche OS49.16) par la copie de or/3 avec la deletion en phase 
presente sur le vecteur. Les clones resultant de cette recombinaison sont attendus comme 

10 apraS et hygS apres Telimination des sequences du vecteur. Le genotype des souches 
ainsi obtenues peut etre verifie par hybridation ou par PCR et sequen?age du produit de 
PCR (pour verifier que seule une copie de orf3 deletee en phase est presente dans le 
genome des clones obtenus). Des clones n'ayant que la copie de or/3 avec une deletion 
en phase ont ainsi ete obtenus et leur genotype a ete verifie. Un clone presentant les 

15 caracteristiques recherchees a ete plus particulierement selectionne et a ete nomine 
OS49.67. 

Un echantillon de la souche OS49.67 a ete depose aupres de la Collection 
Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur 
Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 
20 1-2916. 

EXEMPLE 7 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orf8 

Pour realiser 1'inactivation du gene or/8, une construction dans laquelle la cassette 
25 Okyg a ete introduite dans la sequence codante de or/8 a ete obtenue. Pour cela, le 
plasmide pOS49.88 a tout d'abord ete construit. Le plasmide pOS49.88 est derive du 
plasmide pUC19 (numero d'acces GenBank M77789) par insertion d*un fragment de 3.7 
kb (fragment Pstl-EcoKL obtenu a partir du cosmide pSPM5), contenant la fin de orf7, 
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or/8 et le debut de or/9, clone dans les sites Pstl-EcoRI de pUC19. La cassette Ohyg 
(sous forme d'un fragment BamHI, rendu bout franc par traitement a 1' enzyme de 
Klenow) a ete clonee au niveau du site unique Sail de pOS49.88 situe dans orf8 apres 
que toutes les extremites aient ete rendues bout franc par traitement a Fenzyme de 
5 Klenow. 

Le clonage etant bout franc, deux types de plasmides ont ete obtenus selon le sens 
d ? insertion de la cassette : pOS49.106 dans lequel les genes hyg et or/8 sont dans la 
meme orientation et pOS49.120 dans lequel les genes hyg et or/8 sont dans des 
orientations opposees. L'insert du plasmide pOS49.106 a ensuite ete sous-clone dans le 

10 plasmide pOJ260 pour dormer pOS49.107. Pour cela, le plasmide pOS49.106 a ete 
digere par l'enzyme Aspll&I et les extremites ont ete rendues bout franc par traitement a 
l'enzyme de Klenow, ce produit de digestion a ete redigere par l'enzyme Pstl et le 
fragment contenant le gene or/8 dans lequel la cassette £2hyg a ete inseree, a ete clone 
dans le vecteur pOJ260 (cf. ci dessus). Pour cela, le vecteur pOJ260 a ete digere par les 

15 enzymes EcoRV et Pstl et utilise pour la ligation. Cette manipulation permet done 
d'obtenir une ligation orientee puisque chacun des deux fragments est bout franc d'un 
cote et Pstl de l'autre. Le plasmide obtenu a ete nomme pOS49.107. 

Le plasmide pOS49.107 a ete introduit dans la souche ATCC23877 de S. 
ambofaciens par transformation de protoplastes (Kieser, T et al. 9 2000). Apres 

20 transformation des protoplastes, les clones sont selectionnes pour leur resistance a 
Fhygromycine. Les clones resistants a Fhygromycine sont ensuite repiques 
respectivement sur milieu avec hygromycine (antibiotique B) et sur milieu avec 
apramycine (antibiotique A) (cf. figure 9). Les clones resistants a l'hygromycine (HygR) 
et sensibles a l'apramycine (ApraS) sont en principe ceux ou un double evenement de 

25 crossing over s'est produit et qui possedent le gene or/8 interrompu par la cassette Qhyg. 
Le remplacement de la copie sauvage de or/8 par la copie interrompue par la cassette 
Qhyg a ete verifie par Southern Blot. Ainsi, l'ADN total des clones obtenus, a ete digere 
par plusieurs enzymes, separe sur gel d'agarose, transfere sur membrane et hybride avec 
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une sonde correspondant a la cassette SI hyg pour verifier la presence de la cassette dans 
PADN genomique des clones obtenus. Une deuxieme hybridation a ete effectuee en 
utilisant comme sonde 1' insert Pstl-EcoW contenant la fin de orf7, or/8 et le debut de 
or/9 d'une taille d'environ 3,7 kb du plasmide pOS49.88. La verification du genotype 
5 peut etre realisee par toute methode connue de rhomme du metier et notamment par 
PCR en utilisant les oligonucleotides appropries et sequen9age du produit de PCR. 

Un clone or/8::Qhyg a ete choisi et nomme OS49.107. Un echantillon de la souche 
OS49.107 a ete depose aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
10 15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2917. 

EXEMPLE 8 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orflO 

Un fragment d'ADN de 1,5 kb interne au gene orflO a ete obtenu par PCR en 
15 utilisant comme matrice, l'ADN genomique de S. ambofaciens et les amorces suivantes : 

SRMRl : 5' CTGCCAGTCCTCTCCCAGCAGTACG 3' (SEQ ID N° 89) 
SRMR2 : 5' TGAAGCTGGACGTCTCCTACGTCGG 3' (SEQ ID N° 90) 

Ce fragment d'ADN issu de la PCR a ete clone dans le vecteur pCR2.1 commercialise 
par la societe Invitrogen (Carlsbad, Californie, USA). Le plasmide ainsi obtenu a ete 

20 nomme pOS49.32. La cassette Qhyg (sous forme d'un fragment BamHl, cf. ci-dessus) a 
ete clonee au niveau du site unique BstER interne au fragment du gene orfl 0, apres que 
toutes les extremites aient ete rendues bout franc par traitement a Tenzyme de Klenow. 
Le clonage etant bout franc, deux types de plasmides ont ete obtenus selon le sens 
d'insertion de la cassette : pOS49.43 dans lequel les genes hyg et orflO sont dans la 

25 meme orientation et pOS49.44 dans lequel les genes hyg et orflO sont dans des 
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orientations opposees. L'insert du plasmide pOS49.43 a ete transfere (sous forme d'un 
fragment AspllSl-Xbal dont les extremites ont ete rendues bout franc par traitement a 
l'enzyme de Klenow) dans le site EcoRV du plasmide pOJ260 ce qui a permis d'obtenir 
le plasmide pOS49.50. Le plasmide pOS49.50 contenant le fragment du gene orflO 
5 interrompu par la cassette tlhyg a ete introduit dans la souche ATCC23877 de 
Streptomyces ambofaciens. Apres transformation, les clones sont selectionnes pour leur 
resistance a 1'hygromycine. Les clones resistants a 1'hygromycine sont ensuite repiques 
respectivement sur milieu avec hygromycine (antibiotique B) et sur milieu avec 
apramycine (antibiotique A) (cf. figure 9). Les clones resistants a 1'hygromycine (HygR) 

10 et sensibles a l'apramycine (ApraS) sont en principe ceux ou un double evenement de 
crossing over s'est produit et qui possedent le gene orflO interrompu par la cassette 
tihyg. Des clones qui possedaient le marqueur de resistance a rhygromycine porte par la 
cassette et qui avaient perdu le marqueur de resistance a l'apramycine porte par le 
vecteur pOJ260 ont ainsi ete obtenus. L'evenement de remplacement de la copie sauvage 

15 de orflO par la copie interrompue orflO::Qhyg a ete verifie par Southern Blot. Ainsi, 
l'ADN genomique total des clones obtenus, a ete digere par plusieurs enzymes, separe 
sur gel d'agarose, transfere sur membrane et hybride avec une sonde correspondant a la 
cassette Qhyg pour verifier la presence de la cassette dans l'ADN genomique des clones 
obtenus. Une deuxieme hybridation a ete effectuee en utilisant comme sonde le produit 

20 PCR de 1,5 kb interne au gene off 10 (cf. ci-dessus). 

Un clone presentant les caracteristiques attendues (orflO::Qhyg) a ete plus 
particulierement selectionne et nomme OS49.50. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette Qhyg etait bien presente dans le genome de ce clone et 
que Ton obtient bien le profil de digestion attendu dans le cas d'un remplacement, a la 
25 suite d'un double evenement de recombinaison, du gene sauvage par la copie 
interrompue par la cassette tthyg dans le genome de ce clone. La verification du 
genotype peut egalement etre realisee par toute methode connue de l'homme du metier 
et notamment par PCR en utilisant les oligonucleotides appropries et sequen?age du 
produit de PCR. 
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EXEMPLE 9 : Inactivation de genes : principe de la construction d'une souche de 
Streptomyces ambofaciens interrompue selon la technique des « cassettes 
excisables » (cf. Figure 9 et 10) 

5 

Un deuxieme type de cassettes peut etre utilise pour 1' inactivation de genes : les 
cassettes dites « cassettes excisables ». Ces cassettes presentent Tavantage de pouvoir 
etre excisees chez Streptomyces par un evenement de recombinaison specifique de site 
apres avoir ete introduites dans le genome de S. ambofaciens. Le but est d'inactiver 
10 certains genes dans des souches de Streptomyces sans laisser dans la souche finale de 
marqueurs de selection ou de grandes sequences d'ADN n'appartenant pas a la souche. 
Apres excision il subsiste uniquement une courte sequence d'environ une trentaine de 
paires de bases (appele site « cicatriciel ») dans le genome de la souche (cf. figure 10). 

La mise en oeuvre de ce systeme consiste, dans un premier temps, au remplacement 
15 de la copie sauvage du gene cible (grace a deux evenements de recombinaison 
homologue, cf. figure 9) par une construction dans laquelle une cassette excisable a ete 
inseree dans ce gene cible. L'insertion de cette cassette est accompagnee d'une deletion 
dans le gene cible (cf. figure 9). Dans un deuxieme temps, l'excision de la cassette 
excisable du genome de la souche est provoquee. La cassette excisable fonctionne grace 
20 a un systeme de recombinaison specifique de site et a pour avantage de permettre 
l'obtention de mutants de Streptomyces ne portant finalement pas de gene de resistance. 
On s'affranchit egalement d'eventuels effets polaires sur Texpression des genes situes en 
aval du ou des genes inactives (cf. figure 10). 

L'emploi de cassettes excisables a ete decrit et utilise chez de nombreux organismes 
25 dont les cellules de mammifere, de levures et chez E. coli (Bayley et al. 9 1992 ; Brunelli 
et Pall, 1993 ; Camilli et al., 1994 ; Dale et Ow, 1991 ; Russell et al, 1992; Lakso et al. 9 
1992). Ces cassettes excisables utilisent toutes la recombinase specifique de site Cre 
agissant sur les sites lox. Ce systeme de recombinaison provient du bacteriophage PI. 
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Pour la construction d'un systeme de type « cassette excisable » chez Streptomyces, il 
a ete tire partie du systeme de recombinaison specifique de site decrit pour 1' element 
genetique mobile pSAM2 de Streptomyces ambofaciens (Boccard et aL 9 1989a et b). Le 
systeme mis en place consiste dans un premier temps a construire un vecteur 
5 recombinant comportant le gene a interrompre dans lequel est inseree une cassette 
excisable. L'insertion dans le gene cible de la cassette excisable s'accompagne d'une 
deletion dans le gene cible. Elle peut etre realisee par clonage en utilisant des sites de 
restriction presents dans le gene cible ou par recombinaison entre de courtes sequences 
identiques comme decrit par exemple par Chaveroche et al (Chaveroche MK et aL 9 

10 2000). La cassette excisable peut etre construite en utilisant par exemple la cassette 
Qhyg (Blondelet Rouault et aL, 1997). Cette cassette a ete bordee par des sequences attR 
et attL qui flanquent normalement la copie integree de pSAM2 (cf. figure 15). Les 
sequences attL et attR contiennent tous les sites necessaires a la recombinaison site- 
specifique permettant l'excision de pSAM2 ou de tout fragment d'ADN situe entre ces 

15 deux regions (Sezonov et aL, 1997, Raynal et al., 1998). La construction d'une telle 
cassette n'est evidemment pas limitee a l'utilisation d'une cassette tihyg, mais d'autres 
cassettes de resistances peuvent servir de base a la construction de cette cassettte (par 
exemple la cassette Qaac ou ilvph (Blondelet Rouault et aL, 1997)). 

Apres l'obtention de cette construction, la souche de Streptomyces est transformee 
20 avec le plasmide recombinant. Les transformants sont ensuite selectionnes avec 
Tantibiotique correspondant a la cassette presente dans le gene cible (cf. figure 9, 
antibiotique B, il s'agit par exemple d'une selection par l'hygromycine si la cassette 
excisable derive de la cassette Qhyg). On selectionne ainsi un melange de clones parmi 
lesquels il y a eu integration par un seul ou par deux evenements de recombinaison. 
25 Dans un deuxieme temps on recherche les clones sensibles a l'antibiotique pour lesquels 
le gene de resistance est present dans le vecteur (hors de la cassette de recombinaison) 
(cf. figure 9, antibiotique A). On peut ainsi selectionner les clones pour lesquel il y a eu 
en principe deux evenements de recombinaison aboutissant au remplacement du gene 
sauvage par la copie interrompue par la cassette. Ces etapes sont schematisees figure 9, 
30 le genotype des clones ainsi obtenus est verifie par Southern blot et une souche 
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presentant les caracteristiques voulues (le remplacement du gene sauvage par la copie 
interrompue par la cassette excisable) est selectionnee. 

Dans un deuxieme temps, la souche selectionnee ci-dessus, est transformee par un 
plasmide permettant l'expression des genes xis et int qui sont tous deux necessaires a la 
5 recombinaison specifique de site entre les sites attR et attL, Cette recombinaison 
entraine le depart de la cassette excisable du genome de la souche, grace a un evenement 
de recombinaison (cf. figure 10) (Raynal et aL, 1998). II est interessant de choisir le 
vecteur portant les genes xis et int parmi les vecteurs relativement instables chez 
Streptomyces (par exemple derive du vecteur Streptomyces pWHM3, (Vara et aL, 
10 1989)), ceci permet d'obtenir une souche ayant perdu ce dernier vecteur apres quelques 
cycles de sporulation en absence de pression de selection. 

Pour exciser la cassette, on peut par exemple utiliser le plasmide pOSV508 (cf. figure 
14) qui est introduit par transformation de protoplastes dans la souche de 5. ambofaciens 
contenant un gene interrompu par la cassette excisable. Le plasmide pOSV508 est derive 

15 du plasmide pWHM3 (Vara J et aL, 1989) (cf. figure 13) dans lequel ont ete ajoutes les 
genes xis et int de pSAM2 (Boccard F. et aL, 1989b) places sous le controle du 
promoteur ptrc (Amann, E. et aL, 1988). Les genes xis et int places sous le controle du 
promoteur ptrc ont ete sous clones dans le plasmide pWHM3 a partir du plasmide 
pOSint3 (Raynal et aL, 1998) (cf. figure 14). L'introduction dans la souche mutante du 

20 plasmide pOSV508 portant les genes xis et int de pSAM2 va permettre Texcision 
efficace par recombinaison specifique de site de la cassette excisable entre les sites attL 
et attR flanquant cette cassette (Raynal A. et aL, 1998) (figure 10). Parmi les 
transformants, selectionnes pour leur resistance au thiostrepton due au gene tsr porte par 
pOSV508, on choisit ceux devenus sensibles a l'antibiotique auquel la presence de la 

25 cassette confere la resistance (cf. figure 10). L'excision est efficace et il a ete observe 
que plus de 90% des transformants sont de ce type. Apres un ou plusieurs cycles de 
croissance et sporulation sur un milieu solide depourvu de thiostrepton, on obtient des 
clones ayant perdu le plasmide pOSV508. Ces clones sont reperables par leur sensibilite 
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au thiostrepton. La sequence du gene cible delete peut etre verifiee par PCR et 
sequen?age du produit PCR. 

Finalement, la souche resultante porte au niveau du gene inactive (deletion interne par 
exemple) un site att « cicatriciel » correspondant au site attB minimal (Raynal et al., 
5 1998), issu de la recombinaison entre les sites attR et attL. Ce site attB minimal qui 
subsiste est semblable a celui present naturellement dans les souches de Streptomyces 
ambofaciens, Streptomyces pristinaespiralis et Streptomyces lividans (Sezonov et al. 9 
1997). 

Le gene que Ton veut inactiver peut etre cotranscrit avec d'autres genes situes en 
10 aval. Pour eviter que l'inactivation d'un des genes ait un effet polaire sur l'expression 
des genes en aval dans l'operon, il est important d'obtenir une deletion en phase apres 
excision de la cassette. Le systeme des cassettes excisables tel que decrit ci-dessus 
permet de repondre a une telle exigence. L'homme du metier pourra, en effet, aisement 
construire trois cassettes excisables distinctes, celles-ci laissant apres excision une 
15 sequence de 33, 34 ou 35 nucleotides respectivement, sans codon stop quelle que soit la 
phase de lecture. Connaissant la sequence du gene cible et la taille de la deletion 
associee a l'insertion de la cassette, il est possible de choisir entre ces trois cassettes 
excisables de fa?on a ce que l'excision conduise a une deletion en phase. Sur les 33, 34 
ou 35 nucleotides rajoutes, 26 correspondent a la sequence attB minimale (cf. figure 27). 

20 Dans le cas de la presente demande, deux cassettes excisables ont ete utilisees. Ces 
deux cassettes sont les suivantes : attlQhyg+ (SEQ ID N° 91) et att3Qaac- (SEQ ID N° 
92), ces cassettes laissent respectivement 33 et 35 nucleotides apres excision. Elles 
comportent respectivement la cassette Qhyg ou la cassette Qaac, les signes + et - 
correspondant a Torientation de la cassette de resistance. Ces deux cassettes ont ete 

25 construites et clonees au niveau du site EcoRV du vecteur pBC SK+ dont le site HindHl 
a ete suprime au prealable. Les plasmides obtenus ont ete nommes pattlfihyg+ et 
patt3flaac- respectivement. Les cassettes excisables peuvent etre facilement sorties par 
une digestion du plasmide par EcoRV. 
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EXEMPLE 10 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orf2 

L'inactivation du gene or/2 a ete realisee grace a la technique des cassettes 
excisables (cf. ci-dessus). La souche de depart utilisee est la souche Streptomyces 
5 ambofaciens OSC2 qui derive de la souche ATCC23877. Cependant, la souche OSC2 
differe de la souche ATCC23877 en ce qu'elle a perdu l'element genetique mobile 
pSAM2 (Boccard et aL, 1989a et b). Cet element mobile peut etre perdu de maniere 
spontanee au cours de la protoplastisation (action du lysozyme pour digerer la paroi 
bacterienne et fragmenter le mycelium (Kieser et aL, 2000)) et de la regeneration des 

10 protoplastes de la souche ATCC23877. Pour selectionner les clones ayant perdu 
l'element pSAM2, il a ete mis en place un crible, base sur la repression du gene pra par 
le represseur de transcription KorSA (Sezonov et aL, 1995) (Sezonov G. et al. 9 2000). 
Pour cela, un fragment d'ADN contenant le promoteur du gene pra place en amont du 
gene aph (conferant la resistance a la kanamycine et depourvu de son propre promoteur) 

15 a ete clone dans le vecteur instable pWHM3Hyg, ce dernier derivant du plasmide 
pWHM3 (Vara et al., 1989) dans lequel le gene tsr a ete remplace par le gene hyg 
(conferant la resistance a l'hygromycine). Le plasmide ainsi obtenu a ete nomme 
pOSV510. La souche ATCC23877 a ete transformee apres protoplastisation par le 
plasmide pOSV510. Le promoteur Pra est un promoteur reprime par le represseur 

20 KorSA, le gene codant ce dernier etant situe au sein de l'element mobile pSAM2 
(Sezonov G. et aL, 2000). Apres transformation par le plasmide pOSV510, les bacteries 
transformees sont selectionnees pour leur resistance a la kanamycine (due au gene aph 
porte par pOSV510). Les clones ayant perdu l'element integratif pSAM2 ont perdu le 
represseur KorSA et le promoteur Pra n'est done plus reprime et permet l'expression du 

25 gene de resistance a la kanamycine aph. Une selection par la kanamycine apres 
transformation par le plasmide pOSV510 permet done de selectionner les clones ayant 
perdu l'element integratif pSAM2 (et done KorSA) et possedant le plasmide pOSV510. 
Le plasmide pOSV510 etant instable, apres quelques cycles de sporulation sans 
antibiotique, des clones isoles sont repiques sur milieu avec kanamycine, sur milieu avec 

30 hygromycine et sur milieu sans antibiotique. Les clones sensibles a la kanamycine et a 
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l'hygromycine ont perdu pOSV510. La perte de 1'element pSAM2 a ete verifiee par 
hybridation et PCR. Un clone presentant les caracteristiques souhaitees a ete selectionne 
et a ete nomme OSC2. 

Un echantillon de la souche OSC2 a ete depose aupres de la Collection Nationale 
5 de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
2908. 

L'inactivation du gene orf2 a ete realisee grace a la technique des cassettes 
excisables (cf. ci-dessus et figure 10). Pour cela, un insert de 4,5 kb dont la sequence 
10 part du site EcoRI situe en position 1 jusqu'au site BamHl situe en position 4521 (SEQ 
ID N° 1) a ete sous-clone au niveau des sites EcoRI et BamUI du plasmide pUC19 
(numero d'acces GenBank M77789) a partir du cosmide pSPM5. Le plasmide ainsi 
obtenu a ete nomme pOS49.99. 

Ce plasmide a ete introduit dans la souche E. coli KS272 qui contenait deja le 
15 plasmide pKOBEG (Chaveroche et al., 2000) (cf. figure 12). 

En parallele, la cassette excisable att3Qaac- (SEQ ID N° 92, cf. ci dessus) a ete 
amplifiee par PCR en utilisant comme matrice le plasmide pOSK1102 (Le plasmide 
pOSK1102 est un plasmide derive du vecteur pGP704Not (Chaveroche et al., 2000) 
(Miller VL & Mekalanos JJ, 1988) dans lequel la cassette att3Qaac- a ete clonee comme 
20 un fragment EcoRV dans le site unique EcoRV de pGP704Not) et a l'aide des amorces 
suivantes : 

ORF2A 

5 » CCCGCGCGGCAGCCTCTCCGTGATCGAGTCCGGCGTGACCATCGCGCGCGCTTCGTTCGG - 3 ' (SEQ 
25 ID N° 93) 
ORF2B 

5' GCTCCGTGCGTCATGCAGGAAGGTGTCGTAGTCGCGGTAGATCTGCCTCTTCGTCCCGAA - 3 1 (SEQ 
ID N° 94) 
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Les 40 deoxy-nucleotides situes a l'extremite 5 1 de ces oligonucleotides 
comportent une sequence correspondant a une sequence dans le gene cible (or/2 dans le 
cas present) et les 20 deoxy-nucleotides situes le plus en 3 f (figure en gras ci-dessus) 
correspondent a la sequence d'une des extremites de la cassette excisable att3Qaac- (cf. 
5 figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli contenant 
les plasmides pKOBEG et pOS49.99 comme decrit (Chaveroche et aL, 2000) (cf. figure 
12). Ainsi, les bacteries ont ete transformees par electroporation et selectionnees pour 
leur resistance a Tapramycine. Les plasmides des clones obtenus ont ete extraits et 

10 digeres par plusieurs enzymes de restriction, dans le but de verifier que le profil de 
digestion obtenu correspond au profil attendu s'il y a eu insertion de la cassette 
(att3tiaac~) dans le gene cible (or/2), c'est a dire si il y a bien eu recombinaison 
homologue entre les extremites du produit PCR et le gene cible (Chaveroche et aL, 
2000). La verification de la construction peut egalement etre realisee par toute methode 

15 connue de 1'homme du metier et notamment par PCR en utilisant les oligonucleotides 
appropries et sequen?age du produit de PCR. Un clone dont le plasmide possede le 
profil attendu a ete selectionne et le plasmide correspondant a ete nomme pSPM17. Ce 
plasmide derive de pOS49.99 dans lequel or/2 est interrompue par la cassette 
apramycine (cf. figure 12). 

20 L'insertion de la cassette s'accompagne d'une deletion dans or/2, entre les nucleotides 
21 1 et 492 de la partie codante de or/2. 

Le plasmide pSPM17 a ete digere par l'enzyme EcoRI puis les extremites ont ete 
rendues bout franc par traitement a l'enzyme de Klenow, ce produit de digestion a ete 
ensuite digere par l'enzyme Xbal et F insert contenant le gene or/2 delete a ete clone 

25 dans le vecteur pOSK1205 (cf. ci dessus). Pour cela, le vecteur pOSK1205 a ete digere 
par l'enzyme BamHl puis les extremites ont ete rendues bout franc par traitement a 
l'enzyme de Klenow, ce produit a ete ensuite digere par l'enzyme Xbal, et utilise pour la 
ligation avec l'insert obtenu a partir de pSPM17 comme ci-dessus. Cette manipulation 
permet done d'obtenir une ligation orientee puisque chacun des deux fragments est bout 

30 franc d'un cote et Xbal de l'autre. Le plasmide ainsi obtenu a ete nomme pSPM21, il 
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porte un gene de resistance a l'hygromycine (partie vecteur) et un insert dans lequel le 
gene or/2 delete est remplace par la cassette att3tiaac-. 

Le vecteur pSPM21 a ete introduit dans la souche Streptomyces ambofaciens OSC2 
(cf. ci dessus) par transformation de protoplastes (Kieser, T et al, 2000). Apres 
5 transformation, les clones sont selectionnes pour leur resistance a l'apramycine Les 
clones resistants a l'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf figure 
9). Les clones resistants a Tapramycine (ApraR) et sensibles a l'hygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 

10 possedent le gene orfl interrompu par la cassette att3Qaac-. Ces clones ont ete 
selectionnes et le remplacement de la copie sauvage de or/2 par la copie interrompue par 
la cassette a ete verifie. La presence de la cassette att3Qaac- a ete verifiee par PCR sur 
colonie. Une hybridation a egalement ete effectuee. Pour cela, PADN total des clones 
obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere sur 

15 membrane et hybride avec une sonde de 3 kb correspondant a un fragment EcoRI- 
BamHI de Tinsert du plasmide pOS49.99 (cf ci-dessus). La verification du genotype 
peut egalement etre realisee par toute methode connue de l'homme du metier et 
notamment par PCR en utilisant les oligonucleotides appropries et sequen9age du 
produit de PCR. 

20 Un clone presentant les caracteristiques attendues a ete selectionne et nomme 
SPM21. II a pu etre verifie grace a la PCR et a l'hybridation que la cassette att3Qaac- 
etait bien presente dans le genome de ce clone et que Ton obtient bien le profil de 
digestion attendu dans le cas d'un remplacement, a la suite d'un double evenement de 
recombinaison, du gene sauvage par la copie interrompue par la cassette att3£laac- dans 

25 le genome de ce clone. Ce clone possede done le genotype : orf2::att3f2aac-. 

Un echantillon de la souche SPM21 a ete depose aupres de la Collection Nationale 
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
2914. 
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La souche SPM21 a ete transformee par le vecteur pOSV508 par transformation de 
protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le plasmide 
pOSV508 est derive du plasmide pWHM3 (Vara J et aL, 1989) (cf. figure 13) dans 
lequel il a ete ajoute les genes xis et int de pSAM2 (Boccard F. et aL, 1989b) place sous 
5 le controle du promoteur ptrc (Amann, E. et aL, 1988) (cf. figure 14). L'introduction 
dans la souche SPM21 du plasmide pOSV508 portant les genes xis et int de pSAM2 
permet l'excision efficace par recombinaison specifique de site de la cassette excisable 
entre les sites attL et attR flanquant cette cassette (Raynal A. et aL, 1998) (figure 10). 
Parmi les transformants selectionnes pour leur resistance au thiostrepton due au gene tsr 

10 porte par pOSV508, on choisit ceux devenus sensibles a l'apramycine dont le gene de 
resistance est porte par la cassette att3f2aac-, l'excision entraine en effet la perte de ce 
gene de resistance (cf. figure 10). Le plasmide pOSV508 est instable et apres deux 
passages successifs sur milieu sans antibiotique des clones isoles sont repiques sur 
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles au 

15 thiostrepton ont perdu pOSV508. II a ete verifie que l'excision de la cassette aboutit bien 
a une deletion en phase dans le gene or/2 par PCR et sequen?age du produit PCR, 
l'excision de la cassette laisse en effet une sequence « cicatricielle » att3 caracteristique 
(qui est similaire au site attB d'origine apres recombinaison entre les sites attL et attR) : 

5' ATCGCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3' (SEQ ID N° 95). 

20 La souche ainsi obtenue et possedant le genotype voulu (or/2::att3) a ete nominee 
SPM22. 

Un echantillon de la souche SPM22 a ete depose aupres de la Collection Nationale 
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
25 2915. 
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EXEMPLE 11 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene or/22 

Pour I'inactivation de orfl2, orf!3c et off 14 un meme plasmide de depart 
(pSPM504) a ete employe pour introduire a differentes positions une cassette de type 
5 « cassette excisable ». Ce plasmide possede un insert de 15,1 kb qui correspond a la 
region de or/7 a orf!7. Pour construire ce plasmide un fragment BglU de 15,1 kb 
provenant de la digestion du cosmide pSPM7 (cf. ci-dessus) a ete clone dans le plasmide 
pMBL18 (Nakano et ai, 1995) digere par BamHl. Les extremites BamHl et BglE etant 
compatibles, on obtient apres ligation, le plasmide pSPM502. La totalite de 1'insert de 
10 pSPM502 a ensuite ete sous-clone (sous forme d'un fragment HindSUNheT) dans le 
plasmide pOSK1205 (digere par HindlWNhel) ce qui a permis d'obtenir le plasmide 
pSPM504. 

Ce plasmide a ete introduit dans la souche E. coli KS272 qui contenait deja le 
plasmide pKOBEG (Chaveroche et aL, 2000) (cf. figure 12). 

15 En parallele, la cassette excisable att3tiaac- a ete amplifiee par PCR en utilisant 

comme matrice le plasmide pOSKl 102 (le plasmide pOSKl 102 est un plasmide derive 
du vecteur pGP704Not (Chaveroche et aL, 2000) (Miller VL & Mekalanos JJ, 1988) 
dans lequel la cassette att3Qaac- a ete clonee comme un fragment EcoRY dans le site 
unique EcoRY de pGP704Not), les amorces utilisees sont les suivantes : 

20 EDR8 : 5 ' CGGGATGATCGCTTGTCCGGCGGCCGGATGCCTAGCCTCATCGCGCGCGCTTCGTTCGG 3 ' 
(SEQ ID N° 96) 

EDR9 : 5 ' CCCGATCCAGAACGTCTGGTCGGTGATCAGGTCGCTGTTCATCTGCCTCTTCGTCCCGAA 3 ' 
(SEQ ID N° 97) 

25 Les 40 (seulement 39 pour EDR8) deoxy-nucleotides situes a l'extremite 5 ? de ces 

oligonucleotides comportent une sequence correspondant a une sequence dans le gene 
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cible (or/12 dans le cas present) et les 20 deoxy-nucleotides situes le plus en 3' (figure en 
gras ci-dessus) correspondent a la sequence d'une des extremites de la cassette excisable 
att3Qaac- (cf. figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
5 KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
Chaveroche et al. (Chaveroche et al. 9 2000) (cf. figure 12 pour le principe, le plasmide 
pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM507). Ainsi, les bacteries ont ete transformees par electroporation 
par ce produit de PCR et les clones ont ete selectionnes pour leur resistance a 

10 l'apramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette (att3tlaac-) dans le gene 
cible {prfl2\ c'est a dire si il y a bien eu recombinaison homologue entre les extremites 
du produit PCR et le gene cible (Chaveroche et aL, 2000). La verification de la 

15 construction peut egalement etre realisee par toute methode connue de l'homme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne 
et le plasmide correspondant a ete nomme pSPM507. Ce plasmide derive de pSPM504 
dans lequel or/12 est interrompue par la cassette att3Qaac- (cf. figure 12). ^insertion de 

20 la cassette s'accompagne d'une deletion dans le gene orJ12 9 l'interruption commence au 
niveau du trentieme codon de or/12. II reste apres la cassette les 46 derniers codons de 
orfl2. 

Le vecteur pSPM507 a ete introduit dans la souche Streptomyces ambofaciens OSC2 
(cf. ci-dessus) par transformation de protoplastes (Kieser, T et al., 2000). Apres 

25 transformation, les clones sont selectionnes pour leur resistance a Fapramycine. Les 
clones resistants a l'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a l'apramycine (ApraR) et sensibles a Thygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 

30 possedent le gene or/12 interrompu par la cassette att3Qaac-. Ces clones ont ete plus 
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particulierement selectionnes et le remplacement de la copie sauvage de orfl2 par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, l'ADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- pour 
5 verifier la presence de la cassette dans l'ADN genomique des clones obtenus. Une 
deuxieme hybridation a ete effectuee en utilisant comme sonde un fragment d'ADN 
obtenu par PCR et correspondant a une tres large partie de la sequence codante du gene 
orfl2. 

La verification du genotype peut egalement etre realisee par toute methode connue de 
10 Thomme du metier et notamment par PCR en utilisant les oligonucleotides appropries et 
sequen?age du produit de PCR. 

Un clone presentant les caracteristiques attendues (prfl2::att3Qaac-) a ete plus 
particulierement selectionne et nomme SPM507. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de ce 

15 clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette att3Qaac- dans le genome de ce clone. Ce clone 
possede done le genotype : orfl2::att3£laac- et a ete nomme SPM507. H est inutile de 
proceder a l'excision de la cassette pour Fetude de l'effet de 1'inactivation de orfl2, au 

20 vu de l'orientation des genes (cf. figure 3). En effet, le fait que orfl3c soit oriente en 
sens oppose a orfl2 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une 
cassette excisable permet en revanche d' avoir la possibility de se debarrasser du 
marqueur de selection a tout moment, notamment par transformation par le plasmide 
pOSV508. Un echantillon de la souche SPM507 a ete depose aupres de la Collection 

25 Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur 
Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 
1-2911. 
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EXEMPLE 12 : Construction d'une souche de Streptomyces ambofaciens 
inter romp ue dans le gene orfl3c 

La cassette excisable att3Qaac- a ete amplifiee par PCR en utilisant comme 
matrice le plasmide pOSKl 102 (cf. ci-dessus) a l'aide des amorces suivantes : 

5 

EDR3 : 5 ' ACCGGGGCGGTCCTCCCCTCCGGGGCGTCACGGCCGCGGAATCTGCCTCTTCGTCCCGAA 3' 
(SEQ ID N° 98) 

EDR4 : 5 ' CACGCAGCGAGCCGACGCACTGATGGACGACACGATGGCCATCGCGCGCGCTTCGTTCGG 3 ' 
(SEQ ID N° 99) 

10 

Les 40 deoxy-nucleotides situes a Textremite 5 f de ces oligonucleotides comportent 
une sequence correspondant a une sequence dans le gene cible (prflSc dans le cas 
present) et les 20 deoxy-nucleotides situes le plus en V (figure en gras ci-dessus) 
correspondent a la sequence d'une des extremites de la cassette excisable att3Qaac- (cf. 
15 figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
Chaveroche et al. (Chaveroche et al. 9 2000) (cf. figure 12 pour le principe, le plasmide 
pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus 

20 pSPM17 mais pSPM508). Ainsi, les bacteries ont ete transformees par electroporation 
par le produit de PCR et les clones ont ete selectionnes pour leur resistance a 
1'apramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac~) dans le gene 

25 cible (orfl3c), c'est a dire si il y a bien eu recombinaison homologue entre les extremites 
du produit PCR et le gene cible (Chaveroche et al., 2000). La verification de la 
construction peut egalement etre realisee par toute methode connue de Thomme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne 

30 et le plasmide correspondant a ete nomme pSPM508. Ce plasmide derive de pSPM504 
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dans lequel orfl3c est interrompue par la cassette apramycine (cf. figure 12). L'insertion 
de la cassette s'accompagne d'une deletion dans le gene orfl3c, rinterruption commence 
au niveau du sixieme codon de orfl3c. II reste apres la cassette les 3 derniers codons de 
orfl3c. 

5 Le vecteur pSPM508 a ete introduit dans la souche Streptomyces ambofaciens 

OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et aL, 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a Tapramycine. Les 
clones resistants a l'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 

10 9). Les clones resistants a Tapramycine (ApraR) et sensibles a lliygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orfl3c interrompu par la cassette att3Qaac-. Ces clones ont ete plus 
particulierement selectionnes et le remplacement de la copie sauvage de orf!3c par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, l'ADN total des 

15 clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- pour 
verifier la presence de la cassette dans l'ADN genomique des clones obtenus. Une 
deuxieme hybridation a ete effectuee en utilisant comme sonde un produit de PCR 
correspondant a une sequence debordant d'une centaine de paires de base en amont et en 

20 aval de la sequence codante de orfl3c. La verification du genotype peut egalement etre 
realisee par toute methode connue de Thomme du metier et notamment par PCR en 
utilisant les oligonucleotides appropries et sequengage du produit de PCR. 

Un clone presentant les caracteristiques attendues (orfl3c::att3£2aac-) a ete plus 
particulierement selectionne et nomme SPM508. II a pu en effet etre verifie grace aux 
25 deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de ce 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette att3Qaac- dans le genome de ce clone. Ce clone 
possede done le genotype : orfl3c::att3f2aac- et a ete nomme SPM508. H est inutile de 
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proceder a Texcision de la cassette pour Tetude de l'effet de Tinactivation de or/13c, au 
vu de l'orientation des genes (cf. figure 3), le fait que orfl4 soit oriente en sens oppose a 
orfl3c montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d'avoir la possibility de se debarrasser du marqueur de 
5 selection a tout moment. Un echantillon de la souche SPM508 a ete depose aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue 
du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero 
d'enregistrement 1-2912. 



10 EXEMPLE 13 Construction d'une souche de Streptomyces ambofaciens 
inter rompue dans le gene or/14 

La cassette excisable att3Qaac- a ete amplifiee par PCR en utilisant comme 
matrice le plasmide pOSKl 102 (cf. ci-dessus) a Paide des amorces suivantes : 

EDR5 : 5 ' GGGCGTGAAGCGGGCGAGTGTGGATGTCATGCGAGTACTCATCGCGCGCGCTTCGTTCGG 3 ' 
15 (SEQ ID N° 100) 

EDR6 : 5 ' CGGGAAACGGCGTCGCACTCCTCGGGGGCCGCGTCAGCCCATCTGCCTCTTCGTCCCGAA 3 ' 
(SEQ ID N° 101) 

Les 40 deoxy-nucleotides situes a Textremite 5' de ces oligonucleotides comportent 
20 une sequence correspondant a une sequence dans le gene cible (orfl4 dans le cas 
present) et les 20 deoxy-nucleotides situes le plus en 3 f (figure en gras ci-dessus) 
correspondent a la sequence d f une des extremites de la cassette excisable att3tiaac- (cf. 
figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
25 KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
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Chaveroche et ah (Chaveroche et aL 9 2000) (cf. figure 12 pour le principe, le plasmide 
pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM509). Ainsi, les bacteries ont ete transformees par electroporation 
par le produit de PCR et les clones ont ete selectionnes pour leur resistance a 
5 1'apramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s f il y a eu insertion de la cassette (att3Qaac-) dans le gene 
cible (orf!4), c'est a dire si il y a bien eu recombinaison homologue entre les extremites 
du produit PCR et le gene cible (Chaveroche et aL, 2000). La verification de la 

10 construction peut egalement etre realisee par toute methode connue de l'homme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne 
et le plasmide correspondant a ete nomme pSPM509. Ce plasmide derive de pSPM504 
dans lequel orfl4 est interrompu par la cassette apramycine (cf. figure 12). ^insertion de 

15 la cassette s'accompagne d'une deletion dans le gene orfl4 9 1'interruption commence au 
niveau du quatrieme codon de orfl4. II reste apres la cassette le dernier codon de orfl4. 

Le vecteur pSPM509 a ete introduit dans la souche Streptomyces ambofaciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et ai, 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a 1'apramycine. Les 

20 clones resistants a 1'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a Tapramycine (ApraR) et sensibles a Thygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orfl4 interrompu par la cassette att3Qaac-. Ces clones ont ete plus 

25 particulierement selectionnes et le remplacement de la copie sauvage de orfl4 par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, l'ADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- pour 
verifier la presence de la cassette dans l'ADN genomique des clones obtenus. Une 

30 deuxieme hybridation a ete effectuee en utilisant comme sonde un produit de PCR 
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correspondant a une sequence debordant d'une centaine de paires de base en amont et en 
aval de la sequence codante de orfl4. La verification du genotype peut egalement etre 
realisee par toute methode connue de l'homme du metier et notamment par PCR en 
utilisant les oligonucleotides appropries et sequen?age du produit de PCR. 

5 Un clone presentant les caracteristiques attendues {prfl4::aU3Qaac-) a ete plus 

particulierement selectionne et nomme SPM509. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de ce 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 

10 la copie interrompue par la cassette att3Qaac- dans le genome de ce clone. Ce clone 
possede done le genotype : orfl4::att3£2aac- et a ete nomme SPM509. II est inutile de 
proceder a F excision de la cassette pour F etude de l'effet de Finactivation de orfl4 9 au 
vu de Forientation des genes (cf. figure 3), le fait que orflSc soit oriente en sens oppose 
a orfl4 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 

15 excisable permet en revanche d' avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Un echantillon de la souche SPM509 a ete depose aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue 
du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero 
d'enregistrement 1-2913. 

20 

EXEMPLE 14: Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orf6* 

L'inactivation du gene orf6* a ete realisee grace a la technique des cassettes 
excisables (cf. ci-dessus et figure 10). Pour cela, le cosmide pSPM7 a ete utilise comme 
25 matrice pour amplifier un fragment du gene orf6* grace aux oligonucleotides suivants : 

C9583 : 5' CTGCAGGTGCTCCAGCGCGTCGATCT 3' (oligo sens) (SEQ ID N° 102) 
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C9584 : 5' CTGCAGACGGAGGCGGACCTGCGGCT 3' (oligo antisens) (SEQ ID N° 
103) 

Les 20 deoxy-nucleotides situes a Textremite 3' de ces oligonucleotides 
correspondent a une sequence situee dans la partie codante du gene orf6* (SEQ ED N° 
5 13) et les 6 deoxy-nucleotides situes les plus en 5' correspondent a la sequence d'un site 
Pstl permettant de faciliter le clonage par la suite. Le fragment d'ADN amplifie fait une 
taille d'environ 1,11 kb. Ce produit de PCR est clone dans le vecteur pGEM-T Easy 
(commercialise par la societe Promega (Madison, Wisconcin, USA)) ce qui a permis 
d'obtenir le plasmide nomme pBXLl 1 1 1 (cf. figure 16). 

10 La cassette excisable attinhyg+ a ensuite ete introduite dans la sequence codante 

du gene orf6*. Pour cela, le plasmide pBXLllll a ete digere par les enzymes de 
restriction Smal et AspHSl et le produit de digestion a ete traite par 1' enzyme de 
Klenow. Cette manipulation permet de realiser une deletion interne de 120 pb dans la 
sequence codante du gene orf6* (cf. figure 15). De plus, de part et d'autre des sites de 

15 restrictions, il reste respectivement 511 pb et 485 pb de la sequence de orf6* qui 
permettront la recombinaison homologue pour Tinactivation du gene orf6*. La cassette 
excisable attlf2hyg+ a ete preparee a partir du plasmide pattlQhyg+ (cf. ci-dessus) par 
digestion de ce plasmide par EcoRV. Cette derniere a ensuite ete sous-clonee dans le 
vecteur pBXLl 111 prealablement prepare comme decrit ci-dessus (digestion Smal et 

20 Aspll&l puis traitement a Penzyme de Klenow). Le plasmide obtenu a ete nomme 
pBXL1112 (cf. figure 17). Dans cette construction, le gene orf6* comporte une deletion 
de 120pb et est interrompu par la cassette attl£2hyg+. 

Le plasmide pBXL1112 a ete ensuite digere par Tenzyme Pstl (site bordant la 
cassette puisque present dans les oligonucleotides PCR) et Finsert Pstl de 3.7 kb 
25 comprenant une partie de orf6* interrompu par la cassette attl£ihyg+ a ensuite ete clone 
au niveau du site Pstl du plasmide pOJ260 (cf. ci-dessus). Le plasmide ainsi obtenu a ete 
nomme pBXL1113. 
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Le vecteur pBXL1113 a ete introduit dans la souche Streptomyces ambofaciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et ai, 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a rhygromycine. Les 
clones resistants a Thygromycine sont ensuite repiques respectivement sur milieu avec 

5 hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A) (cf figure 
9). Les clones resistants a l'hygromycine (HygR) et sensibles a l'apramycine (ApraS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orf6* interrompu par la cassette attinhyg+. Ces clones ont ete plus 
particulierement selectionnes et le remplacement de la copie sauvage de orf6* par la 

10 copie interrompue par la cassette a ete verifie par la technique du Southern blot. Ainsi, 
l'ADN total des clones obtenus, a ete digere par plusieurs enzymes, separe sur gel 
d'agarose, transfere sur membrane et hybride avec une sonde correspondant au gene hyg 
(obtenu par PCR) pour verifier la presence de la cassette dans l'ADN genomique des 
clones obtenus. Une deuxieme hybridation a ete effectuee en utilisant comme sonde 

15 Tinsert Psil-Pstl contenant le gene orf6*> d'une taille d'environ 1,1 kb et obtenu a partir 
du plasmide pBXLllll (cf. ci-dessus et figure 16). La verification du genotype peut 
egalement etre realisee par toute methode connue de 1'homme du metier et notamment 
par PCR en utilisant les oligonucleotides appropries et sequensage du produit de PCR. 

Un clone presentant les caracteristiques attendues (orf6*::attl£2hyg+) a ete plus 
20 particulierement selectionne et nomme SPM501. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette attlf2hyg+ etait bien presente dans le genome de ce 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette attl{2hyg+ dans le genome de ce clone. Ce clone 
25 possede done le genotype : orf6*::attlf2hyg+ et a ete nomme SPM501. Un echantillon 
de la souche SPM501 a ete depose aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2909. 
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La souche SPM501 a ete transformee par le vecteur pOSV508 par transformation 
de protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le plasmide 
pOSV508 est derive du plasmide pWHM3 (Vara J et al, 1989) (cf. figure 13) dans 
lequel les genes xis et int de pSAM2 (Boccard F. et al, 1989b) places sous le controle 
5 du promoteur ptrc (Amann, E. et al., 1988) ont ete ajoutes (cf. figure 14). L'introduction 
dans la souche SPM501 du plasmide pOSV508 portant les genes xis et int de pSAM2 
permet l'excision efficace par recombinaison site specifique de la cassette excisable 
entre les sites attL et attR flanquant cette cassette (Raynal A. et al., 1998) (figure 10). 
Parmi les transformants, selectionnes pour leur resistance au thiostrepton due au gene tsr 

10 porte par pOSV508, on choisit ceux devenus sensibles a 1'hygromycine dont le gene de 
resistance est porte par la cassette attl{2hyg+, l'excision entraine en effet la perte de ce 
gene de resistance (cf. figure 10). Le plasmide pOSV508 est instable et apres deux 
passages successifs sur milieu sans antibiotique des clones isoles sont repiques sur 
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles au 

15 thiostrepton ont perdu pOSV508. II a ete verifie que l'excision de la cassette a bien eu 
lieu en phase dans le gene orf6* par PCR et sequensage du produit PCR. L'interruption 
commence au 158 ,eme codon, 40 codons sont deletes (120pb) et l'excision de la cassette 
laisse une sequence « cicatricielle » attl caracteristique de 33pb : 5 f 
ATCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3' (SEQ ID N° 104). 

20 La souche ainsi obtenue et possedant le genotype voulu (orf6*::attl) a ete nominee 
SPM502. 

Un echantillon de la souche SPM502 a ete depose aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 
Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2910. 



25 
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EXEMPLE 15 : Analyse des souches de Streptomyces ambofaciens interrompue 
dans les genes orf2, orf3, orfB, or/20, orf!2 y orfl3c, orf!4, or/6* 

Pour tester la production en spiramycine des diverses souches obtenues, un test 
microbiologique base sur la sensibilite d'une souche de Micrococcus luteus a ete mis au 
5 point (cf. (Gourmelen A. et al., 1998)). La souche de Micrococcus luteus utilisee est une 
souche derivee de la souche DSM1790 naturellement sensible a la spiramycine (cette 
souche est disponible notamment aupres de la German Collection of Microorganisms 
and Cell Cultures (Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, 
DSMZ), (Braunschweig, Allemagne), sous le numero DSM1790), la souche utilisee 

10 dans le present test differe de la souche DSM1790 en ce qu'elle est resistante a la 
congocidine. Cette souche est un mutant spontane obtenu par selection sur milieu 
contenant des doses croissantes de congocidine. Une telle souche a ete selectionnee du 
fait que Streptomyces ambofaciens produit a la fois de la spiramycine et de la 
congocidine. Le but etant de doser la production en spiramycine des diverses souches 

15 obtenues grace a un test microbiologique base sur la sensibilite d'une souche de 
Micrococcus luteus, il est necessaire de disposer d'une souche resistante a la 
congocidine. 

Les differentes souches de Streptomyces a tester ont ete cultivees dans des 
erlenmeyers a baffles (erlenmeyers chicanes) de 500 ml contenant 70 ml de milieu MPS 

20 (Pernodet et al, 1993). Les erlenmeyers chicanes ont ete inocules a une concentration 
initiale de 2.5 10 6 spores/ml des differentes souches de S. ambofaciens et mises a 
pousser a 27°C sous agitation orbitale de 250 rpm. Des prelevements de 2 ml de 
suspensions ont ete realises apres 48, 72 et 96 heures de culture et centrifuges. Les 
differents surnageants ont ensuite ete congeles a -20°C. Une dilution au dixieme de ces 

25 surnageants dans du milieu de culture sterile est utilisee pour le test (cf. figure 1 8). 

La souche indicatrice de Micrococcus luteus resistante a la congocidine mais 
sensible a la spiramycine a ete cultivee dans du milieu 2TY (Sambrook et al., 1989) 
contenant de la congocidine a 5 //g/ml pendant 48h a 37°C. La densite optique (DO) de 
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la culture est mesuree et cette culture est diluee de fa<?on a ajuster la densite optique a 4. 
0,4 ml de cette pre-culture est dilue dans 40 ml de milieu DAM5 (Difco Antibiotic 
Medium 5, commercialise par la societe Difco), prealablement porte a une temperature 
d'environ 45°C. Ce milieu est ensuite coule dans une boite carree de 12x12 cm et laisse 
5 a reposer a temperature ambiante. 

Une fois le milieu refroidi et solidifie, des disques en papier Whatman AA (cf. 
Gourmelen A. et al. 9 1998) de 12 mm de diametre ont ete imbibes de 70 jul de la dilution 
au dixieme de chaque surnageant et deposes sur la surface de la boite. Des disques 
imbibes d'une solution de spiramycine de differentes concentrations (2-4-8 /xg/ml dans 
10 du milieu de culture MP5) sont utilises comme gamme etalon. Les boites sont laissees a 
4°C pendant 2 h de fa?on a permettre la diffusion des antibiotiques dans l'agar puis sont 
incubees a 37°C pendant 24 a 48h. 

Si le disque contient de la spiramycine, celle-ci diffuse dans l'agar et inhibe la 
croissance de la souche indicatrice de Micrococcus luteus. Cette inhibition cree un 

15 « halo » autour du disque, ce halo refletant la zone ou la souche de Micrococcus luteus 
n'a pas pousse. La presence de ce halo est done une indication de la presence de 
spiramycine et permet de determiner si la souche de S. ambofaciens correspondant au 
disque en question est productrice ou non productrice de spiramycine. Une comparaison 
avec les diametres d'inhibition obtenus pour la gamme etalon permet d'obtenir une 

20 indication de la quantite de spiramycine produite par cette souche. 

Les differentes souches decrites dans les exemples precedents ont ete utilisees 
dans ce test pour detecter leur production en spiramycine. Les resultats obtenus ont ete 
regroupes dans le Tableau 38. 
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Tableau 38 



Souche 


Oene inactive 


Exemole dans 
lequel la 
souche est 
decrite 


Phenotvne i 
Producteur (+) ou 
non-producteur (-) de 
spiramycine 


ATCC23877 


Aucun 


1 


w 


OS49.16 


orfty.nhyg 


2 


(-) 


OS49.67 


orfideletion en phase 


6 


(•) 


OS49.107 


orfiSy.nhyg 


7 


(-) 


OS49.50 


orflO:: fihyg 


8 


(-) 


0SC2 


Aucun 


10 




SPM21 


orf2::att3f2aac- 


10 


(-) 


SPM22 


orf2::att3 deletion en phase 


10 


(-) 


SPM501 


orf6*::attinhyg± 


14 


(-) 


SPM502 


orf6*::attl deletion en phase 


14 




SPM507 


orfl2::att3Qaac- 


11 




SPM508 


orfl 3c::att3Qaac- 


12 




SPM509 


orfl 4: :att3Qaac- 


13 





Ces resultats permettent de tirer un certain nombre de conclusions en ce qui 
concerne la fonction des differents genes impliques dans la biosynthese de la 
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spiramycine. Ainsi le gene or/3 est essentiel a la biosynthese de la spiramycine. En effet 
une inactivation en phase dans ce gene conduit a une souche (OS49.67, (cf. exemple 6)) 
ne produisant plus de spiramycine. L'inactivation en phase permet d'ecarter l'hypothese 
d'une eventuelle influence de la cassette introduite sur l'expression des genes situes en 
5 aval de or/3. 

De meme, les genes orfS et orflO codent des proteines essentielles a la biosynthese 
de la spiramycine puisque les souches OS49.107 et OS49.50 ont un phenotype non 
producteur. De plus, dans ces deux dernieres souches, c'est bien l'inactivation du gene 
correspondant qui est responsable de ce phenotype non producteur, puisqu'au vu de 
10 rorientation des differentes orfs (cf. figure 3), la construction introduite ne peut avoir 
d'effet polaire. 

L'etude des souches possedant une cassette excisable permet egalement de tirer un 
certain nombre de conclusion en ce qui concerne la fonction des genes interrompus. La 
souche SPM507 possede le genotype : orfl2::att3£2aac~. II est inutile de proceder a 

15 Pexcision de la cassette pour l'etude de l'effet de l'inactivation de orfl2, au vu de 
l'orientation des genes (cf. figure 3). Le fait que orfl3c soit oriente en sens oppose a 
orfl2 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d'avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM507 est non producteur, on 

20 peut done en conclure que le gene orfl2 est un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. 

La souche SPM508 possede le genotype : orfl3c::att3{2aac-. H est inutile de 
proceder a 1'excision de la cassette pour l'etude de l'effet de l'inactivation de orfl3c, au 
vu de l'orientation des genes (cf. figure 3). Le fait que or/14 soit oriente en sens oppose 
25 a orfl3c montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d 'avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM508 est producteur, on peut 
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done en conclure que le gene orfl 3c n'est pas un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. 

La souche SPM509 possede le genotype : orfl4::att3Qaac-. II est inutile de 
proceder a l'excision de la cassette pour l'etude de l'effet de l'inactivation de orfl4, au 
5 vu de l'orientation des genes (cf. figure 3), le fait que orfl 5c soit oriente en sens oppose 
a orfl4 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d'avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM509 est non producteur, on 
peut done en conclure que le gene orfl 4 est un gene essentiel a la biosynthese de la 
10 spiramycine chez S. ambofaciens. 

La souche SPM21 possede le genotype : orf2::att3Qaac-. Le phenotype de cette 
souche est non producteur de spiramycines. Cependant, l'orientation des genes orfl a 
orf8 (cf. figure 3) laisse penser que ces genes sont cotranscrits. Aussi, le phenotype 
observe peut etre du a un effet polaire de la cassette introduite dans orf2 sur l'expression 

15 de genes situes en aval dans l'operon. La souche SPM22 possede le genotype orf2::att3 
et a ete obtenue apres excision en phase de la cassette introduite. L'excision de la 
cassette laisse seulement une sequence « cicatricielle » caracteristique (cf. exemple 10). 
La souche SPM22 etant egalement de phenotype non producteur, on peut en conclure 
que le gene orfl est un gene essentiel a la biosynthese de la spiramycine chez S. 

20 ambofaciens. On observe ici uniquement Teffet du a Tinactivation de or/2. 

La souche SPM501 possede le genotype : orf6*::attlf2hyg+. Le phenotype de 
cette souche est non producteur de spiramycines. Cependant, les genes et orf6* 
(cf. figure 3) ayant la meme orientation, le phenotype observe peut etre du a un effet 
polaire de la cassette introduite dans orf6* sur l'expression de orf5*. La disposition de 
25 ces genes laisse penser qu'ils peuvent etre cotranscrits. Pour repondre a cette question, la 
souche SPM502 a ete obtenue apres excision en phase de la cassette introduite. Dans 
cette souche, on observe uniquement l'effet de l'inactivation de orf6*. Cette souche 
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possede le genotype orf6*::attl (cf. exemple 14). L'excision de la cassette laisse 
seulement une sequence « cicatricielle » en phase (cf. exemple 14). La souche SPM502 
possede un phenotype producteur (cette souche ne produit cependant que de la 
spiramycine I (cf*. exemple 16)). On peut done conclure que le gene orf5* est un gene 
5 essentiel a la biosynthese de la spiramycine chez S. ambofaciens, puisque son 
inactivation indirecte dans la souche SPM501 conduit a un phenotype non producteur. 
Par contre ; le gene orf6* n'est pas un gene essentiel a la biosynthese de la spiramycine I 
chez S. ambofaciens (par contre il est essentiel a la production de spiramycine II et III 
(cf. exemple 16)). 

10 

EXEMPLE 16. Dosage de la production des spiramycines I, II et III dans les 
souches mutantes obtenues 

Les differentes souches a tester ont ete cultivees chacune dans 7 erlensmeyers 
chicanes de 500 mL contenant 70 ml de milieu MPS (Pernodet et al., 1993). Les erlens 
15 ont ete inocules par 2.5 10 6 spores/ml des differentes souches de S. ambofaciens et 
mises a pousser a 27°C sous agitation orbitale de 250 rpm pendant 72 heures. Les 
cultures correspondant au meme clone sont rassemblees, eventuellement filtrees sur 
filtre plisse, et centrifiigees 15 min a 7000 tr/min. Les differents surnageants ont ensuite 
ete stockes a -30°C. 

20 Les dosages ont ete effectues par Chromatographic Liquide a Haute Performance 

(CLHP) par appariement d'ions. L'analyse CLHP du milieu de culture permet de 
determiner precisement la concentration des trois formes de spiramycine. La colonne 
utilisee (Macherey-Nagel) est remplie avec une phase Nucleosil de silice greffee octyle. 
La granulomere est de 5^m et la taille des pores 100 A. Le diametre interne de la 

25 colonne est de 4,6mm et sa longueur 25cm. La phase mobile est un melange de tampon 
H3PO4 (pH2,2) et d'acetonitrile 70/30 (v/v) contenant 6,25g/L de perchlorate de 
NaClCU. L'analyse est realisee en regime isocratique avec un debit fixe a 1 ml/min. La 



149 



colonne est thermoregulee a 23°C. La detection est assuree par spectrophotometrie UV 
a 238nm. L'echantillon est refrigere a +10°C et la quantification est determinee a partir 
de l'aire des pics (par etalonnage externe). Dans ces conditions, les temps de retention 
de la spiramycine I, II et HI sont respectivement d'environ 17; 21 et 30 minutes, comme 
5 il a pu etre verifie grace a un echantillon commercial comprenant les trois formes de 
spiramycine. 

La souche OSC2 possede un phenotype producteur de spiramycine. C'est la 
souche parentale utilisee pour Tobtention des souches possedant une cassette excisable 
(cf. exemple 15). Cette souche a done ete utilisee comme temoin positif de production 
10 des trois formes de spiramycine. Cette souche produit bien les trois formes de 
spiramycines comme il a ete verifie par CLHP (cf. figure 19). 

L'etude des souches possedant une cassette excisable permet de tirer un certain 
nombre de conclusions en ce qui concerne la fonction des genes interrompus. La souche 
SPM507 possede le genotype : orfl2::att3Qaac-. Le phenotype de la souche SPM507 
15 est non producteur (cf. exemple 15), on peut done en conclure que le gene or/12 est un 
gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. Cette souche ne 
produit plus de spiramycines comme il a ete verifie par CLHP (cf. figure 22). Ce resultat 
confirme le caractere essentiel du gene orfl2 dans la biosynthese de la spiramycine. 

La souche SPM508 possede le genotype : orfl3c::att3Qaac-. Le phenotype de la 
20 souche SPM508 est producteur de spiramycine (cf exemple 15), on peut done en 
conclure que le gene orfl3c n'est pas un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. Cette souche produit de la spiramycine I, II et HI 
comme il a ete verifie par CLHP (cf figure 23). Ce resultat confirme que le gene orfl3c 
n'est pas un gene essentiel a la biosynthese des spiramycines I, II et HI ches S. 
25 ambofaciens. 

La souche SPM509 possede le genotype : orfl4::att3Qaac-. Le phenotype de la 
souche SPM509 est non producteur, on peut done en conclure que le gene orfl4 est un 
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gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. Cette souche ne 
produit plus de spiramycines comme il a ete verifie par CLHP (cf. figure 24). Ce resultat 
confirme l'essentialite du gene orfl4 dans la biosynthese de la spiramycine. 

La souche SPM501 possede le genotype : orf6*::attlQhyg\-. Le phenotype de 
5 cette souche est non producteur de spiramycines. Cette souche ne produit plus de 
spiramycines comme il a ete verifie par CLHP (cf. figure 20). Cependant, les genes 
or/5* et orf 6* (cf. figure 3) ayant la meme orientation, le phenotype observe peut etre du 
a un effet polaire de la cassette introduite dans orf6* sur l'expression de or/5* dans 
l'operon. Ceci laisse penser que ces genes sont cotranscrits. Pour repondre a cette 

10 question, la souche SPM502 a ete obtenue par excision de la cassette introduite, 
produisant une deletion en phase dans le gene or 6* et restaurant l'expression de or/5*. 
Cette souche possede le genotype orf6*::attl (cf. exemple 14 et 15). L'excision de la 
cassette laisse seulement une sequence att « cicatricielle » en phase (cf. exemple 14). La 
souche SPM502 possede un phenotype producteur de spiramycine. Cependant, comme il 

15 a ete prouve par CLHP, cette souche ne produit que de la spiramycine I et ne produit pas 
de spiramycine II et HI (cf. figure 21). On peut done conclure de ces resultats que le gene 
orfS* est un gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens, 
puisque son inactivation indirecte dans la souche SPM501 conduit a un phenotype non 
producteur de spiramycine (cf. figure 20). Par contre ; le gene orf6* n'est pas un gene 

20 essentiel a la biosynthese de la spiramycine I chez S. ambofaciens, puisque l'inactivation 
de ce gene conduit a un phenotype producteur de spiramycine I (cf. figure 21). 
Cependant, orf6* est essentiel a la production de spiramycine II et IQ (cf. exemple 16)). 
Le gene orf6* code done bien une acyl-transferase responsable de la modification du 
platenolide a la position 3 (cf. figure 1). 

25 
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EXEMPLE 17 : Determination du point de demarrage de la traduction de orf 10 et 
amelioration de la production en spiramycines 

17.1 Construction des plasmides pSPM523, pSPM524 et pSPM525 : 

Le gene or/10 a ete identifie chez Streptomyces ambofaciens et a ete designe 
5 srmR par Geistlich et al. (Geistlich, M., et aL, 1992). L'inactivation du gene or/10 a 
ete realisee (cf. exemple 8). II a pu ainsi etre montre que la souche resultante ne 
produit plus de spiramycines (cf. exemple 15). Ceci confirme que le gene orflO est 
bien implique dans la biosynthese des spiramycines. La proteine codee par ce gene 
est done bien essentielle a la biosynthese des spiramycines. Cependant, l'analyse de 

10 la sequence montre que deux codons ATG situes dans la meme phase de lecture 
peuvent etre utilises pour la traduction de or/10 (cf. Figure 28). Un des deux codons 
possible (le codons le plus en amont) demarre a la position 10656 de la sequence 
donnee en SEQ ID N° 1 , alors que l'autre codon possible situe plus en aval demarre a 
la position 10809 (cf. SEQ ED N° 1). Avant de tester un eventuel effet de la 

15 surexpression de srmR sur la production de spiramycine, il est important de 
determiner dans un premier temps le point de demarrage de la traduction. 

Dans le but de determiner le site de demarrage de la traduction, trois 
constructions comportant trois formes d'orflO ont ete realisees. Ces dernieres ont ete 
obtenues par PCR en utilisant des oligonucleotides comportant soit un site de 
20 restriction Hindm soit un site de restriction BamEl. 

Le premier couple utilise pour l'amplification correspond aux oligonucleotides 
suivants : 
EDR39 : 

5 'CCCAAGCTTGAGAAGGGAGCGGACATTCATGGCCCGCGCCGAACGC3 ' 
25 (SEQ ID N° 122) (le site Hindm figure en gras) 
EDR42 : 

5 'CGGGATCCGGCTGACCATGGGAGACGGGCGC ATCGCCGAGTTCAGC3 9 
(SEQ ID N° 123) (le site BamHl figure en gras) 
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Le couple d'amorces EDR39-EDR42 permet ramplification d'un fragment d'orflO 
comportant l'ATG situe le plus en 3' (position 10809 dans la sequence donnee en 
SEQ ID N° 1) (cf. Figure 28). Le fragment obtenu fait une taille d'environ 2 kb et 
sera appele par la suite "orflO court", il ne contient pas le promoteur de orflO. Ce 
5 fragment de 2kb a ete clone dans le vecteur pGEM-T easy pour donner naissance au 
plasmide pSPM520. 

Le deuxieme couple utilise pour 1' amplification correspond aux oligonucleotides 
suivants : 
EDR40 : 

10 5 'CCC AAGCTTGAGAAGGGAGCGGAC ATTCAATGCTTTGGTAAAGC AC3 ' 
(SEQ ID N° 124) (le site Hindm figure en gras) 
EDR42 : 

5 'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3 ' 

(SEQ ID N° 123) (le site BamHl figure en gras) 
15 Le couple d'amorces EDR40-EDR42 permet ramplification d'un fragment d'orflO 

comportant l'ATG situe le plus en 5' (position 10656 dans la sequence donnee en 

SEQ ID N° 1) (cf. Figure 28). Ce fragment de 2,2 kb appele par la suite "orflO long" 

a ete clone dans le vecteur pGEM-T easy pour donner naissance au plasmide 

pSPM521, ce plasmide ne contient pas le promoteur de orfl 0. 
20 Le troisieme couple utilise pour 1 'amplification correspond aux oligonucleotides 

suivants : 

EDR41 : 

5 '-CCCAAGCTTTCAAGGAACGACGGGGTGGTCAGTC AAGT-3 ' 
(SEQ ID N° 125) (le site Hindm figure en gras) 
25 EDR42 : 

5 'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTC AGC3 ' 
(SEQ ID N° 123) (le site BamHl figure en gras) 

Le couple d'amorces EDR41-EDR42 permet ramplification du gene orflO avec les 
deux ATG, ainsi que son propre promoteur (cf. Figure 28). Ce fragment de 2,8 kb 
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appele par la suite "orflO pro" a ete clone dans le vecteur pGEM-T easy pour donner 
naissance au plasmide pSPM522. 

Le fragment "orflO pro" a ete obtenu en utilisant comme matrice l'ADN 
chromosomique de la souche OSC2. Les fragments "orflO court" et "orflO long" ont 
5 quant a eux ete obtenus en utilisant comme matrice l'ADN du fragment "orflO pro" 
prealablement purifie. 

Les inserts HindBl-Bamm des plasmides pSPM520, pSPM521 et pSPM522 
ont ensuite ete sous-clones dans le vecteur pUWL201 (plamside derive du plasmide 
pUWL199 (Wehmeier UF, 1995) dans lequel le fragment Kpnl-BamHi de la region 

10 du promoteur de ermE (cf. Bibb et al., 1985, notamment figure 2) portant une 
mutation augmentant la force du promoteur (promoteur ermE*) (Bibb et al, 1994) a 
ete introduit (cf. Doumith et al, 2000)) prealablement digere par les enzymes 
HindTtt-BamRI. Ainsi, il a ete obtenu trois plasmides : pSPM523 (derive du 
pUWL201 avec la forme "orflO court" comme insert), pSPM524 (derive du 

15 pUWL201 avec la forme "orflO long" comme insert) et pSPM525 (derive du 
pUWL201 avec la forme "<?>// 0 pro") (Figure 28). 

17.2 Transformation de la souche OS49.50 par les constructions pSPM523. 
PSPM524 etnSPM525: 

La souche OS49.50 (souche interrompue dans le gene orflO, cf. exemple 8) a ete 
20 transformee independamment par transformation de protoplastes (Kieser, T et al, 2000) 
par chacun des plasmides pSPM523, pSPM524 et pSPM525. Un temoin negatif a 
egalement ete realise en transformant la souche OS49.50 par le plasmide pUWL201 sans 
insert. Apres transformation des protoplastes, les clones sont selectionnes pour leur 
resistance au au thiostrepton. La transformation des clones par chacun des plamides est 
25 verifiee par extraction de ces plasmides. Ainsi quatre nouvelles souches ont ete 
obtenues : la souche OSC49.50 pUWL201, issue de la transformation par le plasmide 
pUWL201 sans insert, la souche OSC49.50 pSPM523, issue de la transformation par le 
plasmide pSPM523, la souche OSC49.50 pSPM524, issue de la transformation par le 



154 



plasmide pSPM524 et enfin la souche OS49.50 pSPM525, issue de la transformation par 
le plasmide pSPM525. 

La production de spiramycines de chacune de ces quatre souches a ete testee 
par CLHP. Pour cela, les differentes souches de Streptomyces a tester ont ete 

5 cultivees dans des erlenmeyers a baffles (erlenmeyers chicanes) de 500 ml contenant 
70 ml de milieu MP5 (Pernodet et aL, 1993). Lorsque la souche contient le plasmide 
pUWL201 ou Tun de ses derives, il est ajoute 5 jug/ml de thiostrepton. Les 
erlenmeyers chicanes ont ete inocules a une concentration initiale de 2.5 10 6 
spores/ml des differentes souches de S. ambofaciens et les cultures ont ete incubees a 

10 27°C sous agitation orbitale de 250 rpm pendant 96 heures. Les cellules ont ensuite 
ete separees du milieu par centrifugation et le surnageant a ete analyse par CLHP (cf. 
exemple 16) pour determiner la quantite de spiramycine produite. Grace a un 
echantillon etalon et a la mesure de l'air des pics, il a ete possible de determiner la 
quantite de chacune des spiramycines produites par ces souches. Les resultats de cette 

15 analyse sont presentes dans le tableau 39, les donnees sont exprimees en mg par litre 
de surnageant. Les resultats correspondent a la production totale en spiramycines 
(obtenue en additionnant la production en spiramycine I, II et EI). 

Tableau 39. Production en spiramycines des souches derivees de OS49.50, 



(resultats exprimes en 


Souche 


Production en Spiramycines 


OS49.50 


0 


pUWL201 




OS49.50 


0 


pSPM523 




OS49.50 


93 


pSPM524 
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OS49.50 


149 


pSPM525 





Comme le montre les resultats donnes dans le tableau 39, le temoin negatif 
(souche OS49.50 transformee par le plasmide pUWL201) ne produit pas de 
spiramycine. Lorsque le plasmide pSPM523 (qui contient la forme "orflO court" ) est 
introduit dans la souche OS49.50, aucune production de spiramycine n f est observee. 
5 En revanche, la presence du plasmide pSPM524 (qui contient la forme "orflO long") 
et du plasmide pSPM525 (qui contient la forme "orflO pro") restaure la production 
de spiramycine dans la souche hote OS49.50. Ainsi, seuls les fragments de orflO 
contenant l f ATG le plus en amont permettent de restaurer la synthese de spiramycine. 

Dans le but de confirmer ces resultats, le plasmide pSPM521 (plasmide 
10 pGEM-T easy contenant la forme "orflO long") a ete digere par Tenzyme de 
restriction Xhol (cette enzyme possede un site unique dans ce plasmide, localise entre 
les deux ATG (cf. Figure 28)). Les extremites Xhol ont ensuite ete rendues bout franc 
par traitement a l'enzyme de Klenow. Le plasmide a alors ete referme sur lui-meme 
par action de la T4 DNA ligase pour donner naissance au plasmide pSPM527. Si 
15 l'ATG le plus en amont (position 10656 dans la sequence donnee en SEQ ID N° 1) 
est bien utilise comme site d'initiation de la traduction, ce traitement entrainera un 
decalage du cadre de lecture au niveau du site Xhol et aura pour effet la production 
d'une proteine ne presentant pas d'activite activatrice. Par contre si rinitiation de la 
traduction a lieu au niveau de l'ATG plus en aval (position 10809 dans la sequence 
20 donnee en SEQ ID N° 1), ce traitement devrait avoir peu ou pas d'effet sur 
l'expression de OrflO (compte tenu de la localisation du point de demarrage de la 
transcription) et aucun effet sur la proteine produite. 

L'insert BamHl-HindlU de pSPM527 a ensuite ete sous-clone dans le vecteur 
pUWL201 pour donner naissance au plasmide pSPM528. Ce plasmide a ete introduit 
25 dans la souche OS49.50 et un clone possedant le plasmide voulu a plus 
particulierement ete selectionne. La production de spiramycine de la souche 
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resultante a ensuite ete testee par CLHP (Cf. exemple 16 et ci-dessus). Contrairement 
a ce qui avait ete observe avec le plasmide pSPM524 (cf. tableau 39), la presence du 
plasmide pSPM528 dans la souche OS49.50 ne retablit pas la production de 
spiramycins Ceci confirme que le demarrage de la traduction du gene orflO est 
5 l'ATG situe le plus en aval (ATG 1 cf. Figure 28). 

17.3 Amelioration de la production en spiramycines de la souche OSC2 de S. 
ambofaciens : 

Afin de tester Teffet de la surexpression du gene orfl 0 sur la production de 
spiramycines, les plasmides pSPM523, pSPM524, pSPM525 et pSPM528 ont ete 

10 introduits dans la souche OSC2. Pour cela, des protoplastes de la souche OSC2 ont 
ete transformes (Kieser, T et aL, 2000) independamment par chacun des plasmides 
pSPM523, pSPM524, pSPM525 et pSPM528. Un temoin negatif a egalement ete 
realise en transformant la souche OSC2 par le plasmide pUWL201 sans insert. Apres 
transformation des protoplastes, les clones sont selectionnes pour leur resistance au 

15 au thiostrepton. Ainsi cinq nouvelles souches ont ete obtenues : la souche OSC2 
pUWL201, issue de la transformation par le plasmide pUWL201 sans insert, la 
souche OSC2 pSPM523, issue de la transformation par le plasmide pSPM523, la 
souche OSC2 pSPM524, issue de la transformation par le plasmide pSPM524, la 
souche OSC2 pSPM525, issue de la transformation par le plasmide pSPM525 et 

20 enfin la souche OSC2 pSPM528, issue de la transformation par le plasmide 
pSPM528. La production en spiramycines de ces souches a alors ete analysee par 
CLHP (de la meme maniere que dans l'exemple 17.2). L'analyse de la production en 
spiramycine de la souche OSC2 a egalement ete effectee en parallele pour 
comparaison. Les resultats de cette analyse sont presentes dans le tableau 40, les 

25 donnees sont exprimees en mg par litre de surnageant. Les resultats correspondent a 
la production totale en spiramycines (obtenue en additionnant la production en 
spiramycine I, II et HI). 
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Tableau 40. Production en spiramycines des souches derivees de OSC2, (resultats 

exprimes en mg/1). 





x luuutuuii tu a|jir«tiiijniiC5 


OSC2 


69 


OSC2 
pUWL201 


103 


OSC2 
pSPM523 


19 


OSC2 
pSPM524 


135 


OSC2 
pSPM525 


278 


OSC2 
pSPM528 


68 



Ainsi, il est observe que la presence du plasmide pSPM524 ou du plasmide 
5 pSPM525 augmente significativement la production en spiramycines de la souche 
OSC2. Ceci demontre bien que la surexpression de OrflO a un effet positif sur la 
production en spiramycines. Le plasmide pSPM528 n'a par contre pas d'effet sur la 
production en spiramycines. 

Les plasmides pSPM525 et pUWL201 ont de la meme maniere ete introduit 
10 dans la souche SPM502 (cf. exemple 14). Ainsi deux nouvelles souches ont ete 
obtenues : la souche SPM502 pUWL201, issue de la transformation par le plasmide 
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pUWL201 sans insert, et la souche SPM502 pSPM525, issue de la transformation par 
le plasmide pSPM525. 

Un echantillon de la souche SPM502 pSPM525 (cette souche contient le plasmide 
pSPM525, cf. ci-dessus) a ete depose aupres de la Collection Nationale de Cultures de 
5 Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
15, France, le 26 fevrier 2003 sous le numero d'enregistrement 1-2977. 

La production en spiramycines des souches SPM502 pUWL201 et SPM502 
pSPM525 a ete analysee par CLHP (de la meme maniere que dans l'exemple 17.2). 
L'analyse de la production en spiramycines de la souche SPM502 a egalement ete 
10 effectee en parallele pour comparaison. Les resultats de cette analyse sont presentes 
dans le tableau 41, les donnees sont exprimees en mg par litre de surnageant. Les 
resultats correspondent a la production en spiramycine I. En effet, aucune de ces 
souches ne produit de spiramycine II et HI. 

Tableau 41. Production en spiramycine I des souches derivees de SPM502, 
1 5 (resultats exprimes en mg/1) . 



Souche 


Spiramycine I 


SPM502 


47 


SPM502 pUWL201 


72 


SPM502 pSPM525 


130 



Ainsi, il a pu etre observe que la surexpression du gene orflO dans la souche 
SPM502 augmente de facon importante la production de spiramycine I. 
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EXEMPLE 18 : Construction d'une banque d'ADN genomique de la souche OSC2 
de Streptomyces ambofaciens chez E. coli dans la cosmide pWED2. 

18.1 Construction du cosmide pWED2 : 

Dans le but de faciliter l'inactivation de genes chez Streptomyces, un 
5 cosmide portant la sequence oriT du plasmide RK2 (ce qui permet son introduction 
par conjugaison dans Streptomyces a partir d'une souche appropriee de E. coli) et 
portant egalement un gene de resistance a un antibiotique conferant un phenotype 
reperable chez Streptomyces, a ete construit. Un tel cosmide contenant de grands 
inserts d'ADN genomique de Streptomyces ambofaciens peut etre utilise dans des 

10 experiences deactivation de genes. 

Pour construire ce vecteur, une cassette pac-oriT (fragment EcoRV) a ete 
introduite dans le cosmide pWEDl (Gourmelen et aL, 1998) , derive du cosmide 
pWED15 (Wahl et al, 1987), au niveau du site unique Hpal. La cassette pac-oriT 2l 
ete obtenue par PCR. Pour cela, le gene pac a ete amplifie par PCR a partir du 

15 plasmide pVF 10.4 (Vara et ai, 1985; Lacalle et al, 1989) en utilisant comme 
premiere amorce, Famorce A (de sequence 5'- 
CCAGT AGATATC CCGCCAACCCGGAGCTGCAC-3' (SEQ ID N° 126), le site 
de restriction EcoRV a ete souligne et la sequence en gras de 20 nucleotides 
correspond a une region en amont du promoteur du gene pac) et comme deuxieme 

20 amorce, 1' amorce B (de sequence 5'- 

GAAAAGATCCGT CATGGGGTCGTGCGCTCCTT-3' (SEQ ID N° 127), qui 
comporte a son extremite 5' une sequence de 12 nucleotides correspondant au debut 
de la sequence oriT (souligne double) et une sequence de 20 nucleotides (en gras) 
correspondant a la fin du gene pac (cf. Figure 29, l 6re PCR). 

25 Le gene oriT a quant a lui ete amplifie par PCR a partir du plasmide pPM803 

(Mazodier,P. et al., 1989) en utilisant comme premiere amorce, l'amorce C (de 
sequence 5 f -CACGACCCCATG ACGGATCTTTT CCGCTGCAT-3' (SEQ ID N° 
128)), qui comporte a son extremite 5' une sequence de 12 nucleotides correspondant a 
une sequence en aval de la sequence codante du gene pac (en gras) et une sequence de 
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20 nucleotides correspondant au debut de la sequence oriT) et comme deuxieme 
amorce, l'amorce D (de sequence 5'- 

GAGCCG GATATCATCGGTCTTGCCTTGCTCGT -3' (SEQ ID N° 129)) qui 
comporte le site de restriction EcoRV (souligne simple) et une sequence de 20 
5 nucleotides correspondant a la fin de la sequence oriT (souligne double) (cf. Figure 29, 
2* me PCR). 

Le produit d'amplification obtenu avec les amorces A et B et celui obtenu avec 
les amorces C et D ont a une de leur extremite, une sequence commune de 24 
nucleotides. Une troisieme PCR a ete realisee en melangeant les deux produits 

10 d'amplification obtenus precedemment et en utilisant comme amorces, les amorces A et 
D (cf. figure 29, 3* me PCR). Ceci a permis d'obtenir un produit d'amplification 
correspondant a l'ensemble pac+oriT. Ce fragment pac-oriT a alors ete clone dans le 
vecteur pGEM-T Easy (commercialise par la societe Promega (Madison, Wisconcin, 
USA)), ce qui a permis d'obtenir le plasmide pGEM-T-pac-oriT. L'insert de ce 

15 plasmide a ensuite ete sous clone dans le cosmide pWEDl. Pour cela le plasmide 
pGEM-pac-oriT a ete digere par l'enzyme EcoRV et l'insert EcoRV contenant 
l'ensemble pac+oriT a ete insere dans le cosmide pWEDl ouvert au prealable par 
l'enzyme Hpal. Le cosmide ainsi obtenu a ete baptise pWED2 (cf. Figure 30). 

Ce cosmide permet de faciliter l'inactivation de genes chez Streptomyces. 

20 En effet, il porte la sequence oriT (ce qui permet son introduction par conjugaison 
dans Streptomyces a partir d'une souche appropriee de E. coli) mais egalement un 
gene de resistance a un antibiotique conferant un phenotype reperable chez 
Streptomyces. Un tel cosmide contenant de grands inserts d'ADN genomique de 
Streptomyces ambofaciens peut etre utilise dans des experiences deactivation de 

25 genes. 

Ainsi un cosmide derive de pWED2 contenant le gene cible pourra par 
exmeple etre introduit dans la souche de E. coli KS272 contenant le plasmide 
pKOBEG (cf. Chaveroche et al. 2000) et une cassette sera introduite dans le gene 
cible selon la technique decrite par Chaveroche et al. 2000. Le cosmide obtenu par 
30 cette technqiue (cosmide dans lequel le gene cible est inactive), pourra ensuite etre 
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introduit dans une souche de E. coli telle que la souche SI 7.1 ou toute autre souche 
permettant de transferer par conjugaison des plasmides contenant la sequence oriT 
vers Streptomyces. 

Apres conjugaison entre E. coli et Streptomyces, des clones de Streptomyces 
5 dans lesquelles la copie sauvage du gene cible aura ete remplacee par la copie 
interrompue pourront etre obtenues comme decrit dans Texemple 2. 

Le gene de resistance exprime chez Streptomyces present sur ce nouveau 
cosmide est le gene pac de Streptomyces alboniger (Vara, J et al. y 1985 ; Lacalle et 
al., 1989) qui code la puromycine N-acetyl transferase et qui confere la resistance a la 
10 puromycine. Lors d'experiences deactivation de gene, on cherchera les clones dans 
lesquels un double evenement de recombinaison aura eu lieu. Ces clones auront 
eliminer le cosmide pWED2 et seront done redevenus sensibles a la puromycine. 

18.2 Construction d'une banque d f ADN genomique de la souche OSC2 de 
Streptomyces ambofaciens chez E. coli dans le cosmide pWED2 

15 L'ADN genomique de la souche OSC2 de Streptomyces ambofaciens a ete 

digere partiellement par l'enzyme de restriction BamRl de maniere a obtenir des 
fragments d'ADN de taille comprise entre environ 35 et 45 kb. Ces fragments ont 
ensuite ete clones dans le cosmide pWED2, ce dernier ayant ete au prealable digere par 
BamRl, puis traite par la phosphatase alcaline. Le melange de ligation a ensuite ete 

20 encapside in vitro dans des particules de phages lambda grace au systeme « Packagene® 
Lambda DNA packaging system » commercialise par la societe Promega (Madison, 
Wisconcin, USA) en suivant les recommandations du fabriquant. Les particules 
phagiques obtenues ont ete utilisees pour infecter la souche SURE® d'E. coli 
commercialisee par la societe Stratagene (LaJolla, Californie, USA). La selection des 

25 clones a ete effectuee sur milieu LB + ampicilline (50 /xg/ml), le cosmide pWED2 
conferant la resistance a rampicilline. 
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EXEMPLE 19 : Isolement de cosmides de la nouvelle banque couvrant la region de 
la voie de biosynthese des spiramycines. Sous clonage et sequen^age de fragments 
de ces cosmides. 

19.1 Hybridation sur colonies de la banque genomique de Strevtomyces 
5 ambofaciens OSC2 : 

Des cosmides de la nouvelle banque de Streptomyces ambofaciens OSC2 (cf. 
exemple 1 8) couvrant les orfl * a orflO* ou une partie ou la totalite des orfl a orf25c, 
ou une region plus en amont de Yorf25c ont ete isoles. Pour cela, des hybridations 
successives sur les colonies d'£". coli obtenues selon l'exemple 18 ont ete realisees en 
10 utilisant les 3 sondes suivantes (cf. figure 31): 

- La premiere sonde utilisee correspond a un fragment d'ADN d'environ 0,8kb 
amplifie par PCR en utilisant comme matrice le cosmide pSPM5 et les amorces 
suivantes : 

ORF23c: 5 ACGTGCGCGGTGAGTTCGCCGTTGC-3 ' (SEQ ID N° 130) et 
15 ORF25c : 5 f -CTGAACGACGCCATCGCGGTGGTGC-3 f (SEQ ID N° 131). 

Le produit de PCR ainsi obtenu contient un fragment du debut de Vorf23c, Vorf24c en 
entier et la fin de Vorf25c (cf. figure 31, sonde I). 

- La deuxieme sonde utilisee correspond a un fragment d'ADN d'environ 0,7kb 
amplifie par PCR en utilisant comme matrice l'ADN total de la souche S. 

20 ambofaciens ATCC23877 et les amorces suivantes : 

ORFl*c: 5 , -GACCACCTCGAACCGTCCGGCGTCA-3' (SEQ ID N° 132) et 
ORF2*c : 5 f -GGCCCGGTCCAGCGTGCCGAAGC-3 ? (SEQ IDN° 133). 
Le produit de PCR ainsi obtenu contient un fragment de la fin de 1 'orfl *c et du debut 
de 1 'or/2 *c (cf. figure 3 1 , sonde II). 

25 - La troisieme sonde utilisee correspond a un fragment EcoRl-BamHl d'environ 3kb 
contenant les orfl, orf2 et orfl et obtenu par digestion du plasmide pOS49.99 (cf. figure 
31, sonde m). 
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Environ 2000 clones de la banque obtenue dans l'exemple 18.2 ont ete transferes 
sur filtre pour hybridation sur colonies selon les techniques classiques (Sambrook et aL, 
1989). 

La premiere sonde (cf. figure 31, sonde I) a ete marquee au 32 P par la technique 
5 du « random priming » (Kit commercialise par la societe Roche) et utilisees pour 
l'hybridation sur 2000 clones de la banque, apres transfert sur filtre. L'hybridation a ete 
effectuee a 65°C dans le tampon decrit par Church & Gilbert (Church & Gilbert, 1984). 
Deux lavages ont ete effectues en 2x SSC, 0,1% SDS a 65°C, le premier pendant 10 
minutes et le deuxieme pendant 20 minutes et un troisieme lavage d'une duree de 30 

10 minutes a ensuite ete effectue en 0.2X SSC, 0,1% SDS a 65°C. Dans ces conditions 
d'hybridation et de lavage, 20 clones parmi les 2000 hybrides presentaient un fort signal 
d'hybridation avec la premiere sonde. Ces 20 clones ont ete cultives en milieu LB+ 
ampicilline (50 /ig/ml) et les 20 cosmides correspondants ont ete extraits par lyse 
alcaline (Sambrook et al., 1989) puis ils ont ete digeres par Tenzyme de restriction 

15 BamUL Les produits de digestions ont ensuite ete separes sur gel d'agarose, transferes 
sur membrane de Nylon et hybrides par la premiere sonde (cf. ci-dessus : le produit de 
PCR ORF23c-ORF25c, sonde I) dans les memes conditions que ci-dessus. Douze 
cosmides possedaient un fragment BamHl hybridant fortement avec la sonde utilisee. 
Ces 12 cosmides ont ete nommes pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, 

20 pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44 et pSPM45. Les profils, 
apres digestion par BamHI, de ces 12 cosmides ont ete compares entre eux et avec celui 
du cosmide pSPM5. De plus des experiences d' amplification par PCR en utilisant 
differentes amorces correspondant a differents genes deja identifies dans la region orfl- 
orf25c ont permis de positionner l'insert de certains de ces cosmides les uns par rapport 

25 aux autres et de determiner egalement la localisation de ces inserts dans la region orfl- 
orf25c deja connue (cf. Figure 32). Le cosmide pSPM36 a plus particulierement ete 
choisi car il etait susceptible de contenir une grande region en amont de Yorf25c (cf. 
Figure31 et 32). 
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Dans un deuxieme temps, et en utilisant les memes conditions que celles 
decrites ci-dessus, les 2000 clones de la banque de Streptomyces ambofaciens OSC2 ont 
ete hybrides avec la deuxieme sonde correspondant au produit de PCR : ORFl*c- 
ORP2*c (cf. figure 31, sonde II). Cette hybridation a permis d'isoler des cosmides dont 
5 l'insert est situe dans la region de orfl*c a orfl0*c. Dans les conditions d'hybridation 
utilises, 16 clones parmi les 2000 hybrides presentaient un fort signal d'hybridation avec 
cette deuxieme sonde. Ces 16 clones ont ete cultives en milieu LB+ ampicilline (50 
/ig/ml) et les 16 cosmides correspondants ont ete extraits par lyse alcaline (Sambrook et 
al. 9 1989) puis ils ont ete digeres par l'enzyme de restriction BamHL. Les profils de 

10 digestion (apres digestion par BamHT) de ces 16 cosmides ont ete compares entre eux et 
avec celui du cosmide pSPM7. Des experiences d'amplication par PCR avec les 
amorces ORFl*c et ORF2*c ont permis de choisir deux cosmides qui renfermaient bien 
les genes orfl*c et orf2*c et dont les profils possedaient des bandes communes mais 
aussi des bandes differentes. De plus d'autres experiences d'amplification par PCR en 

15 utilisant differentes amorces correspondant a differents genes deja identifies dans la 
region orfl*c a orfl0*c ont permis de positionner l'insert de ces cosmides les uns par 
rapport aux autres et de determiner egalement la localisation de ces inserts dans la region 
orfl*c a orfl0*c deja connue (cf. Figure 32). Les deux cosmides plus particulierement 
selectionnes ont ete nommes pSPM47 et pSPM48 (cf. Figure 32). 

20 En utilisant les memes conditions que celles decrites ci-dessus, les 2000 clones 

de la banque de Streptomyces ambofaciens OSC2 ont egalement ete hybrides avec la 
troisieme sonde correspondant au fragment d'ADN EcoRl-BamHl du plasmide 
pOS49.99 (cf. figure 31 sonde HI). Cette hybridation a permis d'isoler les cosmides 
contenant la region de Vorfl jusqu'a Yorfi et susceptibles de contenir soit une grande 

25 partie des genes des PKS, soit une grande partie des genes orfl a orf25c de la voie de 
biosynthese des spiramycines. Dans ces conditions d'hybridation, 35 clones parmi les 
2000 hybrides presentaient un fort signal d'hybridation avec la troisieme sonde. Ces 35 
clones ont ete cultives en milieu LB+ ampicilline (50 /xg/ml) et les 35 cosmides 
correspondants ont ete extraits par lyse alcaline (Sambrook et al., 1989) puis digeres par 
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F enzyme de restriction BamHl. Les profils, apres digestion par BamHl, de ces 35 
cosmides ont ete compares entre eux et avec celui du cosmide pSPM5. De plus des 
experiences d'amplification par PCR en utilisant differentes amorces correspondant a 
differents genes deja identifies dans la region orfl a orfl 5c ont permis de verifier que 
5 ces cosmides renfermaient bien des inserts provenant de la region orfl a orf25c et de 
positionner les inserts de ces cosmides les uns par rapport aux autres et par rapport a la 
la region orfl a orf25c deja connue (cf. Figure 32). Cinq cosmides ont ete plus 
particulierement selectionnes, ils ont ete nommes pSPM50, pSPMSl, pSPM53, pSPM55 
et pSPM56 (cf. Figure 32). 

10 19.2 Sous clonage et sequencage d'une partie de F insert du cosmide pSPM36. 

La sonde d'environ 0,8 kb obtenue par PCR avec les amorces ORF23c et ORF25c 
(cf ci-dessus et figure 31, sonde I) a egalement ete utilisee dans des experiences de 
Southern Blot sur FADN total de S. ambofaciens OSC2 digere par Fenzyme Pstl. Dans 
les conditions d'hybridation decrite ci-dessus, cette sonde revele un fragment unique 

15 Pstl d'environ 6 kb lorsque hybride sur FADN total de S. ambofaciens OSC2 digere par 
Fenzyme Pstl. II existe un site Pstl au niveau de F or/2 3c (cf SEQ ID N° 80) mais aucun 
autre site Pstl jusqu'a Fextremite (site BamHl) de la sequence connue (cf SEQ ID N° 
1). Ce fragment Pstl-BamHl a une taille d'environ 1.4 kb. Le fragment Pstl de 6 kb 
hybride sur FADN total de S. ambofaciens digere par Fenzyme Pstl contient done une 

20 region d'environ 4,6 kb situee en amont de orf25c. Cette region est susceptible de 
contenir d'autres genes dont les produits sont impliques dans la voie de biosynthese de 
la spiramycine. II a ete verifie par digestion que le cosmide pSPM36 contenait bien ce 
fragment Pstl de 6 kb. Ce fragment a ete isole a partir de pSPM36, dans le but de 
determiner la sequence plus en amont de orf25c. Pour cela, le cosmide pSPM36 a ete 

25 digere par Fenzyme de restriction Pstl Le fragment Pstl-Pstl d'une taille d'environ 6kb 
a ete isole par electrocution a partir d'un gel d'agarose 0.8% puis clone dans le vecteur 
pBK-CMV (4512bp) (commercialise par la societe Stratagene (La Jolla, Californie, 
USA)). Le plasmide ainsi obtenu a ete nomme pSPM58 (cf Figure 33) et la sequence de 
son insert a ete determinee. La sequence de cet insert est presentee en SEQ ID N° 134. 
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Toutefois, toute la sequence n'a pas ete determinee et il subsite un trou d'environ 450 
nucleotides, la partie de la sequence non determinee a ete notee par une succession de 
« N » dans la sequence correspondante. 

19.3 Analyse des nouvelles sequences nucleotidiques, determination des phases 
5 ouvertes de lecture et caracterisation des genes impliques dans la biosynthese des 
spiramycines. 

La sequence de Tinsert du cosmide pSPM58 obtenue a ete analysee grace au 
programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, parmi 
les phases ouvertes de lecture, les phases ouvertes de lecture presentant un usage des 

10 codons typique de Streptomyces. Cette analyse a permis de determiner que cet insert 
comporte 4 nouvelles ORFs en amont de Yorf25c (cf. figure 34). Ces genes ont ete 
nommes orf26 (SEQ ID N° 107), or/27 (SEQ ID N° 109), orf28c (SEQ ID N° 111, la 
sequence de cette orf n'a pas ete determinee completement puisqu'un trou d'environ 450 
nucleotide subsite lors du sequen?age de l'insert de pSPM58, ces 450 nucleotides 

15 figurent sous la forme d'une sere de « N » dans la sequence SEQ ID N° 1 1 1) et or/29 (la 
sequence de cette derniere orf etait incomplete dans cette insert). Le « c » ajoute dans le 
nom du gene signifiant pour l'ORF en question que la sequence codante est dans 
l'orientation inverse (cf. figure 34). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
20 comparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et al., 1990) (Altschul et aL, 1997), CD-search, (ces 
deux programmes sont accessibles notamment aupres du National Center for 
Biotechnology Information (NCBI) (Bethesda, Maryland, USA)), FASTA ((Pearson W. 
R & D. J. Lipman, 1988) et (Pearson W. R., 1990) (ce programme est accessible 
25 notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycines. 
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19,4 Sous clonage et sequencage d'une autre partie de 1'insert du cosmide 
PSPM36. 

La sonde d'environ 0,8 kb obtenue par PCR avec les amorces ORF23c et ORF25c 
(cf. ci-dessus et figure 31, sonde I) a egalement ete utilisee dans des experiences de 
5 Southern Blot sur l'ADN total de la souche OSC2 digere par l'enzyme Stul. Dans les 
conditions d'hybridation decrite ci-dessus pour cette sonde, cette sonde revele un 
fragment unique Stul d'environ 10 kb lorsque hybride sur l'ADN total de la souche 
OSC2 digere par l'enzyme Stul. Compte tenu de la presence d'un site Stul dans V or/2 3c 
(cf. SEQ ED N° 80) et de la localisation de ce site par rapport au site Pstl, ce fragment 

10 de 10 kb inclut la totalite du fragment Pstl precedemment etudie (insert de pSPM58) et 
permet d'avoir acces a une region non encore etudiee d'environ 4 kb. (cf figure 33). II a 
ete verifie par digestion que le cosmide pSPM36 contenait bien ce fragment Stul de 10 
kb. Ce fragment a ete isole a partir du cosmide pSPM36, dans le but de determiner la 
sequence de la fin d y orf29 et d'autres genes plus en amont de or/29. Pour cela, le 

15 cosmide pSPM36 a ete digere par l'enzyme de restriction Stul Le fragment Stul-Stul 
d'une taille d'environ 10 kb a ete isole par electrocution a partir d'un gel d'agarose 
0.8% puis clone dans le vecteur pBK-CMV (4512bp) (commercialise par la societe 
Stratagene (La Jolla, Californie, USA)). Le plasmide ainsi obtenu a ete nomme pSPM72 
(cf. Figure 33). Ce dernier a ensuite ete digere par EcoRI (site EcoKI dans 1'insert de 

20 pSPM58) et HindHl (site HindHl dans le site de clonage multiple du vecteur, 
immediatement apres le site Stul de l'extremite de 1'insert) (cf. Figure 33). Le fragment 
d'ADN EcoRl-HindUl ainsi obtenu, correspond a un fragment de 1'insert du plasmide 
pSPM72 (cf. figure 33) et a ete sous-clone dans le vecteur pBC-SK+ (commercialise par 
la societe Stratagene (La Jolla, Californie, USA)) digere au prealable par EcoKl et 

25 HindHl. Le plasmide ainsi obtenu a ete nomme pSPM73 et la sequence de son insert a 
ete determinee. La sequence de cet insert est presentee en SEQ ID N° 135. 
Un assemblage des sequences des inserts de pSPM58 et pSPM73 est presente en SEQ 
ID N° 106. Cette sequence part du site Pstl au niveau de Yorf23c (cf. SEQ ID N° 80) et 
va jusqu'au site Stul au niveau de Vorf32c (cf. figure 34). La sequence de Yorf28c (SEQ 

30 ID N° 111), n'etant pas complete (cf. exemple 19.3), une region d'environ 450 
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nucleotides n'est pas sequencee, ces 450 nucleotides figurent sous la forme d'une serie 
de « N » dans la sequence SEQ ID N° 106). 

19.5 Analyse des nouvelles sequences nucleotidiques, determination des phases 
5 ouvertes de lecture et caracterisation des genes impliques dans la biosvnthese des 
spiramycines. 

La sequence partielle de T insert du cosmide pSPM73 obtenue a ete analysee grace 
au programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, 
parmi les phases ouvertes de lecture, les phases ouvertes de lecture presentant un usage 

10 des codons typique de Streptomyces. Cette analyse a permis de determiner que cet insert 
comporte 4 ORFs, une incompletes et trois completes (cf. figure 34). L'ORF incomplete 
correspond a la partie 3' de la sequence codante de orf29 ce qui a permis de completer la 
sequence de ce gene grace a la sequence partielle de ce meme orf obtenue lors du 
sequen9age de l'insert du plasmide pSPM58 (cf. exemple 19.2 et 19.3), Tensemble des 

15 deux sequences a ainsi permis d'obtenir la sequence complete de or/29. Les 4 genes ont 
ainsi ete nommes orf29 (SEQ ID N° 113), or/30c (SEQ ID N° 115), or/31 (SEQ ID N° 
118) et or/3 2c (SEQ ID N° 120). Le « c » ajoute dans le nom du gene signifiant pour 
PORF en question que la sequence codante est dans Torientation inverse (cf. figure 34). 

Les sequences proteiques deduites de ces phases ouvertes de lecture (SEQ ID N° 
20 1 14 pour or/29, SEQ ID N° 1 16 et 1 17 pour or/30c, SEQ ID N° 1 19 pour or/31 et SEQ 
ID N° 121 pour or/3 2c) ont ete comparees avec celles presentes dans differentes bases 
de donnees grace a differents programmes : BLAST (Altschul et aL, 1990) (Altschul et 
al. 9 1997), CD-search, (ces deux programmes sont accessibles notamment aupres du 
National Center for Biotechnology Information (NCBI) (Bethesda, Maryland, USA)), 
25 FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990) (ce programme 
est accessible notamment aupres du centre de ressources INFOBIOGEN, Evry, France). 
Ces comparaisons ont permis de formuler des hypotheses sur la fonction des produits de 
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ces genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycines. 

19.6 Sous clonage et sequencage d'une troisieme partie de 1'insert du cosmide 
PSPM36. 

5 Une sonde (fragment d'ADN de 0,8 kb) correspondant a une sequence interne a 

orf32c a ete obtenue par PCR en utilisant comme matrice l'ADN total de la souche de 
Streptomyces ambofaciens et les amorces suivantes 

KF36: 5'- TTGCCGTAGCCG AGG ACC AGCG-3 ' (SEQ ID N° 151) et 
KF37: 5'- CACATGGCCCTGGAGGACCCTG-3' (SEQ ID N° 152). 

10 Le produit PCR ainsi obtenu represente une sequence interne de Y or/3 2c. Cette 

sonde a ete utilisee dans des experiences de Southern Blot sur l'ADN chromosomique 
de la souche OSC2 et sur l'ADN du cosmide pSPM36 digeres par l'enzyme Pstl. En 
utilisant les memes conditions d'hybridation que celles decrites ci-dessus (cf. exemple 
19.1), cette sonde revele deux fragments Pstl d'environ 3,4kb et 2,5kb lorsque hybridee 

15 sur l'ADN total de la souche OSC2 et sur l'ADN du cosmide pSPM36 digeres par 
l'enzyme Pstl. Compte tenu de la presence d'un site Pstl dans la sonde utilisee on peut 
expliquer ces resultats. Le premier fragment d'ADN qui a une taille d f environ 3,4kb est 
un fragment dont la sequence est deja connue en totalite. La sequence du fragment de 
2,5 kb n'est connue que partiellement, sur une region de 700 pb. Ce fragment, a ete isole 

20 a partir du cosmide pSPM36 dans le but de determiner la sequence de la fin de Vorf32c 
et d'autres genes en amont de ce dernier. Pour cela, le cosmide pSPM36 a ete digere par 
l'enzyme de restriction Pstl. Le fragment Pstl-Pstl d'une taille d'environ 2,5kb a ete 
isole par purification a partir d'un gel d'agarose 0.8% puis clone dans le vecteur pBK- 
CMV (4518bp) (commercialise par la societe Stratagene (La Jolla, Californie, USA)). Le 

25 plasmide ainsi obtenu a ete nomme pSPM79 (cf. Figure 41) et la sequence de son insert 
a ete determinee. 



170 



La sequence de Yorf28c (SEQ ID N° 1 1 1) n'etait pas complete (cf. exemple 19.3). 
En effet, une region d'environ 450 nucleotides n'avait pas pu etre determinee, ces 450 
nucleotides figurent sous la forme d'une sere de « N » dans la sequence SEQ ID N° 106. 
La sequence de la totalite de la region manquante a ete determinee par resequensage de 
5 cette region. La sequence des inserts de pSPM58 et pSPM73 a done ete determinee en 
entier. La sequence complete de la partie codante de Yorf28c est presentee en SEQ ID 
N° 141 et la proteine deduite de cette sequence en SEQ ID N° 142. La sequence de 
l'insert du plasmide pSPM79 est presentee en SEQ ID N° 161. 

Un assemblage des sequences des inserts de pSPM58, pSPM73 et pSPM79 est 
10 presentee en SEQ ID N° 140 (cf. figure 41). Cette sequence part du site Pstl au niveau 
de Yorf2Sc (cf. SEQ ID N° 80) et va jusqu'au site Pstl au niveau de Yorf34c (cf. figure 
41). 

19.7 Analyse des nouvelles sequences nucleotidiques, determination des phases 
ouvertes de lecture et caracterisation des genes pouvant etre impliques dans la 
15 biosvnthese des spiramveines. 

La sequence de F insert du plasmide pSPM79 obtenue a ete analysee grace au 
programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, parmi 
les phases ouvertes de lecture, les phases ouvertes de lecture presentant un usage des 
codons typique de Streptomyces. Cette analyse a permis de determiner que cet insert 
20 comporte 3 ORFs, deux incompletes (prf32c et orf34c) et une complete (or/33) (cf. 
figure 41). 

La premiere ORF incomplete correspond a la partie 5' de la sequence codante de 
orf32c. Ceci a permis de completer la sequence de ce gene grace a la sequence partielle 
de cette meme orf obtenue lors du sequen?age de Finsert du plasmide pSPM73 (cf. 
25 exemple 19.4 et 19.5), Fensemble des deux sequences a ainsi permis d'obtenir la 
sequence complete de orf32c. (SEQ ID N° 145). Le « c » ajoute dans le nom du gene 
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signifie pour l'ORF en question que la sequence codante est dans Torientation inverse 
(cf. figure 41). L'orf complete a ete nommee or/33 (SEQ ID N° 147). La troisieme ORF 
a ete nommee orf34c (SEQ ID N° 149). Le « c » ajoute dans le nom du gene signifie 
pour l'ORF en question que la sequence codante est dans Torientation inverse (cf. figure 
5 37). Les comparaisons effectuees entre le produit de cette orf et les banques de donnees 
suggerent que la partie C -terminate de cette proteine n'est pas dans le produit deduit de 
la sequence nucleotidique et done que cette orf serait plus longue et continuerait en 
dehors de la region sequencee. 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
10 comparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et al., 1990) (Altschul et al., 1997), CD-search, (ces 
deux programmes sont accessibles notamment aupres du National Center for 
Biotechnology Information (NCBI) (Bethesda, Maryland, USA)), FASTA ((Pearson W. 
R & D. J. Lipman, 1988) et (Pearson W. R., 1990) (ce programme est accessible 
15 notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycines. 



20 EXEMPLE 20 : Analyse de la production d'intermediaires de biosynthese de 
spiramycines : 

20.1 Preparation des echantillons : 

Les differentes souches a tester ont ete cultivees chacune dans 7 erlenmeyers 
chicanes de 500 ml contenant 70 ml de milieu MPS (Pernodet et al., 1993). Les erlens 
25 ont ete inocules par 2.5 10 6 spores/ml des differentes souches de S. ambofaciens et 
mises a pousser a 27°C sous agitation orbitale de 250 rpm pendant 96 heures. Les 
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cultures correspondant au meme clone sont rassemblees, eventuellement filtrees sur 
filtre plisse, et centrifugees 15 min a 7000 tr/min. 

Le pH du mout est ensuite ajuste a 9 avec de la soude et le surnageant est extrait 
par de la methyl iso-butyryl cetone (MIBK). La phase organique (MIBK) est alors 
5 recuperee et evaporee. L'extrait sec est ensuite repris dans 1ml d'acetonitrile, puis dilue 
au 1/10 (lOOjxl qsp 1ml avec de l'eau) avant d'etre utilise pour les analyses en 
chromatographic liquide couplee a la spectrometrie de masse (CL/SM). 

20.2 Analyse des echantillons en CL/SM : 

10 Les echantillons ont ete analyes en CL/SM dans le but de determiner la masse des 

differents produits synthetises par les souches a tester. 

La colonne de chromatographic liquide haute performance utilisee est une 
colonne Kromasil C8 150*4,6mmm, 5mmm, 100A. 

La phase mobile est un gradient constitue d'un melange d'acetonitrile et d'une solution 
15 aqueuse d'acide trifluoroacetique a 0.05%, le debit est fixe a 1 ml/min. La temperature 
du four colonne est maintenue a 30°C. 

La detection UV en sortie de la colonne a ete effectuee a deux longueurs d'onde 
differentes : 238 nm et 280 nm. 

Le spectrometre de masse couple a la colonne de chromatographic est un appareil 
20 Simple Quadripole commercialise par la societe Agilent, avec des tensions de cone a 30 
eta 70V. 

20.3 Analyse des intermediaires de biosynthese produits par la souche OS49.67 : 

La souche OS49.67 dans laquelle le gene or/3 est inactive par une deletion en 
phase ne produit pas de spiramycines (cf. exemple 6 et 15). 
25 Un echantillon a ete prepare selon la methode decrite ci-dessus (cf. paragraphe 20.1) et 
a ete analyse par CL/SM comme decrit ci-dessus (cf. le paragraphe 20.2). 



173 



Plus particulierement, 1'analyse par chromatographic a ete realisee en gradient de 
solvant avec comme phase mobile : 20% d'acetonitrile du temps T=0 a 5min puis 
montee lineaire a 30% a T=35 minutes, suivie d'un palier jusqu'a T=50 minutes. 

Dans ces conditions, deux produits ont plus particulierement ete observes : un 
5 absorbant a 238 nm (temps de retention de 33.4 min) et un absorbant a 280 nm (temps 
de retention de 44.8 min) (cf. figure 35). La figure 35 montre la superposition des 
chromatogrammes CLHP realises a 238 et 280nm (haut) ainsi que les spectres UV des 
molecules elues a 33,4 minutes et 44,8 minutes (bas). 

Les conditions d'analyses en spectrometrie de masse couplee etaient les suivantes 

10 : le balayage se fait en mode scan, couvrant une gamme de masse comprise entre 100 et 
1000 Da. Le gain de l'electro-multiplicateur etait de IV. Concernant la source 
electrospray, la pression du gaz de nebulisation etait de 35 psig, le debit du gaz sechant 
de 12.0 l.min" 1 , la temperature du gaz sechant de 350°C, la tension du capilaire etait 
portee a +/- 3000 V. Ces experiences ont permis de determiner la masse des deux 

15 produits separes. Ces masses sont respectivement de 370 g/mole pour le produit elue en 
premier ([M-H20] + =353 produit majoritaire) et 368 g/mole pour le second produit ([M- 
H 2 0] + =351 produit majoritaire). 

Afin d'obtenir la structure, les produits mentionnes ci-dessus ont ete isoles et 
purifies dans les conditions suivantes : la phase mobile est un melange d'une solution 

20 aqueuse d'acide trifluoroacetique a 0.05% et d'acetonitrile 70/30 (v/v). La 
chromatographic est realisee en regime isocratique avec un debit fixe de 1 ml/min. Dans 
ces conditions, les temps de retention des 2 produits sont respectivement de 8 et 13.3 
minutes. De plus dans ce cas, Pechantillon prepare (cf. paragraphe 20.1) n'est pas dilue 
dans l'eau avant injecton de 10^1. 

25 Les 2 produits sont recuperes a la sortie de la colonne chromatographique et isoles 

dans les conditions suivantes : une cartouche Oasis HLB 1 cc 30mg (Waters) est 
conditionnee sequentiellement par 1 ml d'acetonitrile, puis 1 ml d'eau/acetonitrile 
(20v/80v) et 1ml d'eau/acetonitrile 80/20. L'echantillon est ensuite introduit et la 
cartouche lavee successivement par 1 ml d'eau/acetonitrile (95/5), 1ml 
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d'eau/acetonitrile deutere (95/5), puis eluee avec 600(xl d'eau/acetonitrile deutere 40/60. 
La solution recuperee est ensuite directement analysee en RMN. 

Les spectres RMN obtenus pour ces deux composes sont les suivants : 
5 - Premier produit elue: Platenolide A: (Spectre 9646V) 

Spectre 1H dans CD3CN (deplacements chimiques en ppm): 0,90 (3H, t, J=6Hz), 0,93 
(3H, d, J=5Hz), 1,27 (3H, d, J-5Hz), entre 1,27 et 1,40 (3H, m), 1,51 (1H, m), 1,95 
(1H, m), 2,12 (1H, m), 2,30 (1H, d, J=12Hz), 2,50 (1H, d, J=llHz), 2,58 (1H, dd, J=9 
et 12 Hz), 2,96 (1H, d, J=7Hz), 3,43 (3H, s), 3,70 (1H, d, J=9Hz), 3,86 (1H, d, J=7Hz), 
10 4,10 (1H, m), 5,08 (1H, m), 5,58 (1H, dt, J=3 et 12Hz), 5,70 (1H, dd, J=8 et 12 Hz), 
6,05 (1H, dd, J=9 et 12 Hz), 6,24 (1H, dd, J=9 et 12Hz). 

-Deuxieme produit elue: Platenolide B: (Spectre 9647V) 

Spectre 1H dans CD3CN (deplacements chimiques en ppm): 0,81 (3H, t, J=6Hz), 0,89 
15 (1H, m), 1,17 (3H, d, J=5Hz), 1,30 (4H, m), 1,47 (2H, m), 1,61 (1H, t, J=10Hz), 2,20 
(1H, m), 2,38 (1H, d, J=13Hz), 2,52 (1H, m), 2,58 (1H, m), 2,68 (1H, dd, J=8 et 13Hz), 
3,10 (1H, d, J=7Hz), 3,50 (3H, s), 3,61 (1H, d, J=8Hz), 3,82 (1H, d, J=7Hz), 5,09 (1H, 
m), 6,20 (1H, m), 6,25 (1H, dd, J=9 et 12 Hz), 6,58 (1H, d, J=12 Hz), 7,19 (1H, dd, J=9 
et 12Hz). 

20 

Ces experiences ont ainsi permis de determiner la structure de ces deux composes. 
Le premier produit elue est le platenolide A et le deuxieme est le platenolide B, la 
structure deduite de ces deux meolecules est presentee en figure 36. 

25 II a egalement pu etre determine grace a la technique de CL/SM associee a la 

RMN, dans des conditions legeremment differentes de celles decrites precedemment 
mais dont la mise au point est bien connue de l'homme du metier, que la souche 
OS49.67 produit en plus du platenolide A et B un derive de ces deux composes. II s'agit 
du platenolide A+mycaorse et du platenolide B+mycarose (la strucutre de ces deux 



composes est presente en figure 40). Les resultats de 1' analyse du mout de la souche 
OS49.67 sont presentes tableau 42. 



Tableau 42. Les resultats de l'analyse CL/SM du mout de la souche OS49.67 



Identite 


[ ] 

(mg/L) 


Masses des ions 


Max 

d'absorption 


Platenolide A 
Masse exacte=370 
Formule 

Moleculaire=C2oH3406 


16,1 


[M + Na] + 
393,0 
[M + K] + 
408,9 

[M-H 2 0 + H] + 
353,0 

[2M + Na] + 
763,2 


231nm 


Platenolide B 
Masse exacte=368 
Formule 

Moleculaire=C2oH3206 


1.4 


[M-H 2 0 + H] + 

351,0 

[M + Na] + 

391,0 

[M +K] + 

406,9 

[2M + Na] + 
759,1 


283nm 


Platenolide A + 'mycarose' 
Masse exacte=514 
Formule 

Moleculaire=C27H4 6 09 


4,27 


[M + Na] + 
537,0 

[M +K] + 
553,0 


230nm 


Platenolide B + 'mycarose' 
Masse exacte=512 
Formule 

Moleculaire=C27H4409 


ND 


[M + Na] + 
535,0 
[M +K] + 
550,9 

[PlatB - H 2 0 + 
H] + 350,9 


284nm 



5 
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20.4 Analyse des intermediaires de biosynthese produits par la souche SPM509 : 

La souche SPM509 dans laquelle le gene orfl4 est inactive {orfl4::att3Qaac-) ne 
produit pas de spiramycines (cf. exemple 13, 15 et 16). Un echantillon a ete prepare 
selon la methode decrite ci-dessus (cf. paragraphe 20.1) et a ete analyse par CL/SM 
comme decrit ci-dessus (cf. le paragraphe 20.2 et 20.3). L'analyse des intermediaires de 
biosynthese presents dans le surnageant de culture de la souche SPM509 cultivee en 
milieu MPS a montre que cette souche ne produisait que la forme B du platenolide 
(« platenolide B », cf. figure 36) mais pas la forme A (« platenolide A », cf. figure 36). 



EXEMPLE 21: Interruption du gene orfl4 dans une souche interrompue dans le 
gene orJ3 (OS49.67) 

Le produit du gene or/14 est indispensable a la biosynthese des spiramycines (cf. 
exemple 13, 15 et 16 : la souche SPM509 dans laquelle ce gene est interrompu ne 
produit plus de spiramycines). L'analyse des intermediaires de biosynthese presents dans 
le surnageant de culture de la souche SPM509 cultivee en milieu MPS a montre que 
cette souche ne produisait que la forme B du platenolide mais pas la forme A (cf. 
exemple 20). Une des hypotheses pouvant expliquer cette observation est que le produit 
de off 14 soit implique dans la conversion de la forme B du platenolide en forme A par 
une etape enzymatique de reduction. Pour tester cette hypothese, le gene orfl4 a ete 
inactive dans un mutant ne produisant plus de spiramycine, mais produisant les formes 
A et B du platenolide. C'est le cas de la souche OS49.67 (cf. exemple 6 et 20) dans 
laquelle le gene or/3 est inactive par une deletion en phase (Aorf3). Pour inactiver le 
gene orfl4 dans cette souche le plasmide pSPM509 a ete introduit par transformation de 
protoplastes de la souche OS49.67 (Kieser, T et aL, 2000). L'inactivation du gene or/14 
a deja ete decrite dans le cas de la souche OSC2 (cf. exemple 13) et il a ete procede de la 
meme maniere pour l'inactivation du gene orf!4 dans la souche OS49.67. Apres 
transformation par le plasmide pSPM509, les clones sont selectionnes pour leur 
resistance a Tapramycine. Les clones resistants a l'apramycine sont ensuite repiques 
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respectivement sur milieu avec apramycine et sur milieu avec hygromycine. Les clones 
resistants a l'apramycine (ApraR) et sensibles a Thygromycine (HygS) sont en principe 
ceux ou un double evenement de crossing over s'est produit et dans lesquels le gene 
orfl4 a ete remplace par une copie de orfl4 interrompue par la cassette att3Qaac-. Ces 
5 clones ont ete plus particulierement selectionnes et le remplacement de la copie sauvage 
de orfl4 par la copie interrompue par la cassette a ete verifie par hybridation. Ainsi, 
l'ADN total des clones obtenus, a ete digere par plusieurs enzymes, separe sur gel 
d'agarose, transfere sur membrane et hybride avec une sonde correspondant a la cassette 
att3Qaac- pour verifier que le remplacement de gene avait bien eu lieu. La verification 
10 du genotype peut egalement etre realisee par toute methode connue de l'homme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age 
du produit PCR. 

Un clone presentant les caracteristiques attendues (Aorfi, orfl4:\att3f2aac-) a ete 
plus particulierement selectionne et nomme SPM510. II a pu en effet etre verifie grace 
15 aux deux hybridations que la cassette att3{2aac- etait bien presente dans le genome de 
ce clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage 
orfl4 par la copie interrompue par la cassette att3C2aac- dans le genome de ce clone. 



20 EXEMPLE 22 : Complementation fonctionnelle de P interruption du gene or/74 

22 A Construction du plasmide pSPM519 : 

Le gene orfl4 a ete amplifie par PCR en utilisant le couple d'oligonucleotides 
suivant: EDR31 : 5' CCCAAGCTTCTGCGCCCGCGGGCGTGAA 3' (SEQ ID N° 
136) et EDR37 : 5' GCTCTAGAACCGTGTAGCCGCGCCCCGG 3' (SEQ ID N° 
25 137) et comme matrice l'ADN chromosomique de la souche OSC2. Les oligonucleotides 
EDR31 et EDR37 portent respectivement le site de restriction HindUl etXbal (sequence 
en gras). Le fragment de 1,2 kb ainsi obtenu a ete clone dans le vecteur pGEM-T easy 
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(commercialise par la societe Promega (Madison, Wisconcin, USA)) pour donner 
naissance au plasmide pSPM515. Ce plasmide a ensuite ete digere par les enzymes de 
restriction HindUl et Xbal. U insert HindUUXbal de 1,2 kb obtenu a ete clone dans le 
vecteur pUWL201 (cf. exemple 17.1) prealablement digere par les memes enzymes. Le 
5 plasmide ainsi obtenu a ete nomme pSPM5 19. 

22.1 Transformation des souches SPM509 et SPM510 par le plasmide 
PSPM519: 

Le plasmide pSPM5 19 a ete introduit dans les souches SPM509 (cf. exemple 13) 
et SPM510 (cf. exemple 17) par transformation de protoplastes (Kieser, T et ah, 2000). 
10 Apres transformation, les clones sont selectionnes pour leur resistance au thiostrepton. 
Les clones sont ensuite repiques sur un milieu contenant du thiostrepton. 

La souche SPM509 est une souche non productrice de spiramycines (cf. exemple 
13, 15 et 16 et figure 24). La production en spiramycines de la souche SPM509 
transformee par le vecteur pSPM519 (souche nominee SPM509 pSPM519) a ete 

15 analysee en cultivant cette souche dans du milieu MP5 en presence de thiostrepton. Les 
surnageants de culture ont ensuite ete analyses par CLHP (cf. exemple 16 et 17). Les 
resultats de cette analyse sont presentes dans le tableau 43, les donnees sont exprimees 
en mg par litre de surnageant. Les resultats correspondent a la production totale en 
spiramycines (obtenue en additionnant la production en spiramycine I, II et HI). II a ete 

20 observe que la presence du vecteur pSPM519 dans la souche SPM509 restaure la 
production de spiramycines (cf. tableau 43). 

Tableau 43. Production en spiramycines de la souche SPM509 transformee par le 
vecteur pSPM519, (resultats exprimes en mg/1 de surnageant). 



Souche 


Production en spyramicines 


SPM509 pSPM519 


58 



179 



La souche SPM510 transformee par le plasmide pSPM519 a ete nommee 
SPM510pSPM509. 

EXEMPLE 23 : Complementation fonctionnelle de Tinterruption du gene or/3 par 
5 le gene tylB de S. fradiae 

23.1 Construction du plasmide pOS49.52 : 

Le plasmide pOS49.52 correspond a un plasmide permettant l'expression de la 
proteine TylB chez S. ambofaciens. Pour le construire, la sequence codante du gene tylB 
de S. fradiae (Merson-Davies & Cundliffe, 1994, numero d'acces GenBank : U08223 

10 (sequence de la region), SFU08223 (sequence ADN) et AAA21342 (sequence 
proteique)) a ete introduite dans le plasmide pKC1218 (Bierman et aL, 1992, Kieser et 
al. 9 2000, une souche de E. coli contenant ce plasmide est accessible notamment aupres 
de TARS (NRRL) Agricultural Research Service Culture Collection) (Peoria, Illinois, 
USA), sous le numero B- 14790). De plus cette sequence codante a ete placee sous le 

15 controle du promoteur ermE* (cf. ci-dessus, notamment exemple 17.1, Bibb et aL, 1985, 
Bibb etal., 1994). 

23.1 Transformation de la souches OS49.67 par le plasmide pOS49.52 : 

La souche OS49.67 dans laquelle le gene or/3 est inactive par une deletion en 
phase ne produit pas de spiramycines (cf. exemple 6 et 15). Le plasmide pOS49.52 a ete 
20 introduit dans la souche OS49.67 par transformation de protoplastes (Kieser, T et al. 9 
2000). Apres transformation, les clones sont selectionnes pour leur resistance a 
l'apramycine. Les clones sont ensuite repiques sur un milieu contenant de l'apramycine. 
Un clone a ete plus particulierement selectionne et a ete nomme OS49.67 pOS49.52. 

Comme il a ete demontre ci-dessus, la souche OS49.67 ne produit pas de 
25 spiramycines (cf. exemple 6 et 15). La production en spiramycines de la souche 
OS49.67 transformee par le vecteur pOS49.52 a ete analysee par la technique decrite 
dans l'exemple 15. II a ainsi pu etre demontre que cette souche possede un phenotype 
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producteur de spiramycines. Ainsi la proteine TylB permet la complementation 
fonctionnelle de l'interruption du gene orfi. 

EXEMPLE 24 : Amelioration de la production en spiramycines par surexpression 
5 du gene orf28c 

24.1 Construction du plasmide pSPM75 : 

Le gene orf28c a ete amplifies par PCR en utilisant un couple d'oligonucleotides 
comportant un site de restriction HindUl ou un site de restriction BamHl. Ces amorces 
ont la sequence suivante : 
10 KF30 : 5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) 
avec un site de restriction HindM (qui figure en gras) 

KF31 : 5' GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) 
avec le site de restriction BamHl (qui figure en gras) 

Les amorces KF30 et KF31 portent respectivement le site de restriction HindSl et 
15 BamHl (sequence en gras). Le couple d'amorces KF30 et KF31 permet d'amplifier un 
fragment d'ADN d'une taille d'environ 1,5 kb contenant le gene orf28c en utilisant 
comme matrice le cosmide pSPM36 (cf. ci-dessus). Le fragment de 1,5 kb ainsi obtenu a 
ete clone dans le vecteur pGEM-T easy (commercialise par la societe Promega 
(Madison, Wisconcin, USA)) pour dormer naissance au plasmide pSPM74. Le plasmide 
20 pSPM74 a ensuite ete digere par les enzymes de restriction HindUl et BamHl et l'insert 
HindUL f BamHl d'environ 1,5 kb obtenu a ete sous clone dans le vecteur pUWL201 (cf. 
exemple 17.1) prealablement digere par les memes enzymes. Le plasmide ainsi obtenu a 
ete nomme pSPM75, il contient l'ensemble de la sequence codante de orf28c placee 
sous le controle du promoteur ermE*. 

25 24.2 Transformation de la souche OSC2 par le plasmide pSPM75 : 

Le plasmide pSPM75 a ete introduit dans les souches OSC2 par transformation 
de protoplastes (Kieser, T et al., 2000). Apres transformation des protoplastes, les 
clones sont selectionnes pour leur resistance au thiostrepton. Les clones sont ensuite 
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repiques sur un milieu contenant du thiostrepton et la transformation par le plasmide est 
verifiee par extraction de plasmides. Deux clones ont plus particulierement ete 
selectionnes et nommes OSC2/pSPM75(l) et OSC2/pSPM75(2). 

Un echantillon de la souche OSC2/pSPM75(2) a ete depose aupres de la 
5 Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue 
du Docteur Roux 75724 Paris Cedex 15, France, le 6 octobre 2003 sous le numero 
d'enregistrement 1-3101. 

Afin de tester l'effet de la surexpression du gene orf28c sur la production de 
spiramycines, la production en spiramycines des clones OSC2/pSPM75(l) et 

10 OSC2/pSPM75(2) a ete testee par la technique decrite dans l'exemple 15. L'analyse de 
la production en spiramycines de la souche OSC2 a egalement ete effectee en parallele 
pour comparaison. II a ainsi pu etre observe que la presence du plasmide pSPM75 
augmente significativement la production en spiramycines de la souche OSC2. Ceci 
demontre que la surexpression de orf28c conduit a une augmentation de la production 

15 en spiramycines et confirme son role en tant que regulateur. 

La production en spiramycines des clones OSC2/pSPM75(l) et 
OSC2/pSPM75(2) a egalement ete analysee par CLHP (de la meme maniere que dans 
l'exemple 17.2). L'analyse de la production en spiramycines de la souche OSC2 a 
egalement ete effectee en parallele pour comparaison. Les resultats de cette analyse sont 
20 presentes dans le tableau 44, les donnees sont exprimees en mg par litre de surnageant 
Les resultats correspondent a la production totale en spiramycines (obtenue en 
additionnant la production en spiramycine I, II et HI). 

Tableau 44. Production en spiramycines des souches derivees de OSC2 
transforme par pSPM75, (resultats exprimes en mg/1). 



Souche 


Spiramycines 


OSC2 


50 
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OSC2/pSPM75(l) 


120 


OSC2/pSPM75(2) 


155 



Ainsi, il est observe que la presence du plasmide pSPM75 augmente 
significativement la production en spiramycines de la souche OSC2. Ceci demontre bien 
que la surexpression de orf28c a un effet positif sur la production en spiramycines. 

5 

EXEMPLE 25 : Analyse de la production d'intermediaires de biosynthese de 
spiramycines d'une souche inactivee dans le gene orfS : 

La souche OS49.107, dans laquelle le gene orfS est inactive par insertion de la 
cassette f2hyg, ne produit pas de spiramycines (cf. exemple 7 et 1 5). Le gene orfS code 

10 une proteine presentant une relative forte similitude avec plusieurs aminotransferases et 
suggere fortement que le gene orfS code une 4 amino-transferase responsable de la 
reaction de transamination necessaire a la biosynthese de la forosamine (cf. figure 6). 
On s'attend done a ce que la biosynthese des spiramycines soit bloquee au stade de la 
forocidine (cf. figure 7). La souche OS49.107 qui est non productrice de spiramycine 

15 devrait done produire de la forocidine. 

Un echantillon de surnageant de la souche OS49.107 a ete prepare selon la 
methode decrite ci-dessus (cf. exemple 16, sans extraction au MIBK) et a ete analyse par 
CL/SM comme decrit ci-dessus (cf. le paragraphe 20.2 et 20.3). En mode SIM, la masse 
558 relative a Tion moleculaire de la forocidine a ete selectionne et plusieurs pics ont 

20 ete detectes. La presence de composes de masse 558 est compatible avec l'hypothese du 
role de orf8 dans synthese de forosamine. 
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EXEMPLE 26 : Analyse de la production d'intermediaires de biosynthese de 
spiramycines d'une souche inactivee dans le gene orfl2 : 

La souche SPM507, dans laquelle le gene orfl2 est inactive, ne produit pas de 
spiramycines (cf. exemple 11 et 15). Le gene orfl2 coderait une 3,4 dehydratase 
5 responsable de la reaction de deshydratation necessaire a la biosynthese de la 
forosamine (cf. figure 6). On s'attend done a ce que la biosynthese des spiramycines soit 
bloquee au stade de la forocidine (cf. figure 7). La souche SPM507 qui est non 
productrice de spiramycine devrait done produire de la forocidine. 

Un echantillon de surnageant de la souche SPM507 a ete prepare selon la methode 

10 decrite ci-dessus (cf. exemple 16, sans extraction au MIBK) et a ete analyse par CL/SM 
comme decrit ci-dessus (cf. le paragraphe 20.2 et 20.3). Dans ces conditions, le temps de 
retention de la forocidine est d'environ 12,9 minutes. En mode SIM, la masse 558 
relative a l'ion moleculaire [M+H] + de la forocidine a ete selectionne et un pic a ete 
detecte. La presence d'un compose a 558 permet de valider l'hypothese du role du 

15 produit de orfl2 dans la biosynthese des spiramycines. 

Toutefois, la forocidine est presente en quantite relativement faible et dans ces 
conditions, un produit absorbant a 238 nm a plus particulierement ete observe (temps de 
retention de 17,1 min). L'analyse en LC/SM a permis de determiner la masse de ce 
compose qui est de 744,3 g/mole ([M+H] + =744,3 produit majoritaire). 

20 Afin d'obtenir la structure, le produits mentionne ci-dessus a ete isole et purifie 

dans les conditions decrites precedemment (cf. paragraphe 20.1) ). La phase organique 
(MIBK) est alors recuperee et evaporee. L'extrait sec est repris avec de l'eau et extrait 
avec de Theptane. La solution aqueuse est ensuite extraite par fixation sur une cartouche 
Oasis HLB 1 g (Waters SAS, St-Quentin en-Yvelines, France). Le compose est recupere 

25 par elution avec un melange eau/acetonitrile 30/70. Cette solution est ensuite injectee 
(IOOjiL) sur la colonne analytique et les fractions recuperees sur cartouche Oasis HLB 1 
cc 30mg (Waters). Avant utilisation, les cartouches Oasis HLB 1 cc 30mg (Waters) sont 
conditionnees sequentiellement par de Tacetonitrile, puis un melangeeau/acetonitrile 
(20v/80v) et un melanged'eau/acetonitrile 80/20. 
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La cartouche Oasis HLB 1 cc 30mg (Waters) est ensuite lavee successivement par 
1 ml d'eau/acetonitrile (95/5), 1ml d'eau/acetonitrile deutere (95/5), puis eluee avec 
600jxl d'eau/acetonitrile deutere 40/60. La solution recuperee est ensuite directement 
analysee en RMN. 

5 Le spectre RMN obtenu pour ce compose est le suivant (Spectre RMN 19312V) : 

Spectre 1H dans CD3CN/D20 (deplacements chimiques en ppm): 0,92 (3H, d, J=6Hz), 
1,10 (1H, m), 1,14 (3H, s), 1,17 (3H, d, J=6Hz), 1,22 (3H, d, J=6Hz), 1,25 (3H, d, 
J=6Hz), 1,40 (1H, m), 1,75 (1H, dd, J=12 et 2Hz), 1,81 (1H, m), 1,90 (1H, d, J=12Hz), 
2,05 (1H, m), 2,12 (3H, s), 2,15 (1H, m), 2,35 (2H, m), 2,45 (6H, s large), 2,53 (1H, m), 
10 2,64 (1H, dd, J=12 et 9Hz), 2,80 (1H, dd, J=9 et 16Hz), 2,95 (1H, d, J=8Hz), 3,23 (2H, 
m), 3,34 (1H, d, J=7Hz), 3,45 (3H, s), 3,49 (1H, m), 3,93 (1H, dd, J=7 et 3Hz), 4,08 
(1H, m), 4,37 (1H, d, J=6Hz), 4,88 (1H, m), 5,05 (2H, m), 5,65 (2H, m), 6,08 (1H, dd, 
J=8 et 12Hz), 6,40 (1H, dd, J=12 et 9Hz), 9,60(1H, s). 

Ces experiences ont ainsi permis de determiner la structure de ce compose, celle- 
15 ci est presentee en figure 38. 

EXEMPLE 27 : Analyse de la production d'intermediaires de biosynthese de 
spiramycines d'une souche inactivee dans le gene orf5* : 

La souche SPM501 possede le genotype orf6*::attlQhyg+. Grace a l'effet polaire 
20 de 1' insertion de la cassette attlQhyg+ dans le gene orf 6* 9 il a pu etre determine que le 
gene Off 5* est indispensable a la voie de biosynthese des spiramycines. En effet, 
Pinsertion de la cassette excisable dans la partie codante du gene orf 6* entraine un arret 
total de la production en spiramycines par effet polaire sur Texpression du gene orf5*. 
Cependant, une fois que la cassette inseree a ete excisee (et done lorsque seul le gene 
25 orf6* est inactive, cf exemples 14 et 15), on restaure une production de spiramycine L 
Ceci demontre que le gene orf 5* est indispensable a la biosynthese des spiramycines 
puisque son inactivation entraine un arret total de la production en spiramycines. 
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Le gene orf5* code une proteine presentant une relative forte similitude avec 
plusieurs O-methyltransferases. Le gene or/5* serait une O-methyl transferase impliquee 
dans la biosynthese du platenolide. Pour verifier cette hypothese, des experiences 
d'analyse CL/SM et de RMN ont ete conduites sur une souche de S. ambofaciens de 
5 genotype orf6*::attl£lhyg+ obtenue a partir d'une souche surproduisant les 
spiramycines. 

Un echantillon du surnageant de cette souche a ete prepare selon la methode 
decrite ci-dessus (cf. exemple 16, sans extraction au MIBK) et a ete analyse par CL/SM 
comme decrit ci-dessus (cf. le paragraphe 20.2 et 20.3). Toutefois, la colonne utilisee est 

10 une colonne X-Terra (Waters SAS, St-Quentin en-Yvelines, France), et la tension de 
cone du spectrometre est reglee a 380V pour obtenir la fragmentation du compose 
analyse. Dans ces conditions, un produit dont le temps de retention est d'environ 13,1 
minutes est observe. Le spectre de masse de ce compose a une allure similaire a celui de 
la spiramycine I mais l'ion moleculaire est a 829. La difference de masse de 14 par 

15 rapport a la masse de la spiramycine peut s'expliquer par l'absence de groupement 
methyl sur l'oxygene portee par le carbone n°4 du cycle lactone (la strucutre de ce 
compose est presente en figure 39). La presence d'un compose a 829 permet de valider 
l'hypothese du role de or/5* dans la biosynthese des spiramycines. 
Par un test microbioogique effectue sur une souche sensible de M. luteus (cf. exemple 

20 15 et figure 18) il a ete demontre que la molecule intermediate (spiramycine moins 
groupement mehyle dont la structure est presentee en figure 39) produite par la souche 
orf6* ::Oatthyg+ est beaucoup moins active (d'un facteur 10) que la spiramycine 
d'origine avec le groupement methyl en position 4. 

25 EXEMPLE 28 : Construction de nouvelles « cassettes excisables » : 

De nouvelles cassettes excisables ont ete construites. Ces cassettes sont tres 
semblables aux cassettes excisables deja decrites dans Texemple 9. La difference 
principale entre les anciennes et les nouvelles cassettes est l'absence dans ces dernieres 
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des sequences correspondant aux extremites de Tinterposon fi, sequences qui 
contiennent un terminateur de transcription provenant du phage T4. 

Dans les cassettes sans terminateur, le gene qui confere la resistance a un 
antibiotique est flanque des sequences attR et attL permettant Texcision. Le gene de 
5 resistance est le gene aac(3)IV qui code une acetyltransferase qui confere la resistance a 
l'apramycine. Ce gene est present dans la cassette Qaac (numero d'acces GenBank : 
X99313, Blondelet-Rouault, M.H. et aL, 1997) et a ete amplifie par PCR en utilisant 
comme matrice le plasmide pOSK1102 (cf. ci-dessus) et comme amorces les 
oligonucleotides KF42 et KF43 contenant chacun le site de restriction HindUl (en 
1 0 gras)(AAGCTT) en 5'. 

KF42: 5'-AAGCTTGTACGGCCCACAGAATGATGTCAC-3' (SEQ ID N° 153) 

et 

KF43: 5 f -AAGCTTCGACTACCTTGGTGATCTCGCCTT-3' (SEQ IDN° 154). 
Le produit PCR obtenu d'environ lkb a ete clone dans le vecteur E. coli pGEMT 
1 5 Easy donnant naissance au plasmide pSPM83 . 

Le vecteur pSPM83 a ete digere par l'enzyme de restriction HindlR. Le fragment 
HindlR-HindUl de Finsert a ete isole par purification a partir d'un gel d'agarose 0,8% 
puis clone dans le site HindlR situe entre les sequences attL et attR des differents 
plasmides portant les differentes cassettes excisables possibles (cf. exemple 9 et figure 
20 27) de fa?on a remplacer le fragment HindUl correspondant a tlacc par le fragment 
HindlR correspondant au gene aac seul. Ceci a permit d'obtenir les cassettes attlaac, 
att2aac et att3aac (selon la phase souhaitee, cf. exemple 9). Selon l'orientation du gene 
aac par rapport aux sequences attL et attR, on distingue attlaac+, attlaac-, att2aac+ 9 
att2aac-, att3aac+ et att3aac- (selon les memes conventions que celles adoptees dans 
25 T exemple 9). 
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EXEMPLE 29 : Construction (Tune souche de S. ambofaciens interrompue dans le 
gene orf28c : 

L'inactivation du gene orf28c a ete realisee grace a la technique des cassettes 
5 excisables. La cassette excisable att3aac+ (cf. exemple 28) a ete amplifiee par PCR en 
utilisant comme matrice le plasmide pSPMlOl (Le plasmide pSPMlOl est un plasmide 
derive du vecteur pGP704Not (Chaveroche et al. 9 2000) (Miller VL & Mekalanos JJ, 
1988) dans lequel la cassette att3aac+ a ete clonee comme un fragment EcoRV dans le 
site unique EcoRV de pGP704Not) et a Taide des amorces suivantes : 
10 KF32: 

5' CAACCGCTTGAGCTGCTCCATCAACTGCTGGGCCGAGGT ATCGCGCGCG 

CTTCGTTCGGGACGAA 3' (SEQ ID N° 155) 

etKF33: 

5' TGGGTCCCGCCGCGCGGCACGACTTCGACTCGCTCGTC TATCTGCCTCTT 
15 CGTCCCGAAGCAACT 3' (SEQ ED N° 156) 

Les 39 nucleotides situes a Textremite 5' de ces oligonucleotides comportent une 
sequence correspondant a une sequence dans le gene orf28c et les 26 nucleotides situes 
le plus en 3' (figure en gras et soulignes ci-dessus) correspondent a la sequence d'une des 

20 extremites de la cassette excisable att3aac+ 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli hyper- 
recombinante DY330 (Yu et al. 9 2000) (cette souche contient les genes exo, bet et gam 
du phage lambda integres dans son chromosome, ces genes sont exprimes a 42°C, elle a 
ete utilisee a la place de la souche E.coli KS272 (Chaveroche et al. 9 2000)) contenant le 

25 cosmide pSPM36. Ainsi, les bacteries ont ete transformees par electroporation par ce 
produit de PCR et les clones ont ete selectionnes pour leur resistance a Tapramycine. Les 
cosmides des clones obtenus ont ete extraits et digeres par Tenzyme de restriction 
BamHl, dans le but de verifier que le profil de digestion obtenu correspondait au profil 
attendu s'il y a eu insertion de la cassette (att3aac+) dans le gene orf28c 9 c'est a dire s'il 

30 y avait bien eu recombinaison homologue entre les extremites du produit PCR et le gene 
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cible. La verification de la construction peut egalement etre realisee par toute methode 
connue de Thomme du metier et notamment par PCR en utilisant les oligonucleotides 
appropries et sequen?age du produit de PCR. Un clone dont le cosmide possede le profil 
attendu a ete selectionne et le cosmide correspondant a ete nomme pSPM107. Ce 
5 cosmide est un derive de pSPM36 dans lequel or/2 8c est interrompue par la cassette 
att3aac+. L'insertion de la cassette s'accompagne d'une deletion dans le gene orf28c, 
Tinterruption commence au niveau du 28eme codon de orf28c II reste apres la cassette 
les 137 derniers codons de orf28c. 

10 Le cosmide pSPM107 a dans un premier temps ete introduit dans la souche E. coli 

DH5a puis dans la souche Streptomyces ambofaciens OSC2 par transformation de 
protoplastes. Apres transformation, les clones sont selectionnes pour leur resistance a 
l'apramycine. Les clones resistants a l'apramycine sont ensuite repiques respectivement 
sur milieu avec apramycine (antibiotique B) et sur milieu avec puromycine (antibiotique 

15 A) (cf. figure 9). Les clones resistants a l'apramycine (ApraR) et sensibles a la 
puromycine (PuroS) sont en principe ceux ou un double evenement de crossing over 
s'est produit et qui possedent le gene orf28c interrompu par la cassette att3aac+. Ces 
clones ont ete plus particulierement selectionnes et le remplacement de la copie sauvage 
de orf28c par la copie interrompue par la cassette a ete verifie par hybridation. Ainsi, 

20 l'ADN total des clones obtenus, a ete digere par plusieurs enzymes, separe sur gel 
d'agarose, transfere sur membrane et hybride avec une sonde correspondant a la cassette 
att3aac+ pour verifier la presence de la cassette au locus attendu dans l'ADN 
genomique des clones obtenus. La verification du genotype peut egalement etre realisee 
par toute methode connue de Thomme du metier et notamment par PCR en utilisant les 

25 oligonucleotides appropries et sequen9age du produit de PCR. 

Un clone presentant les caracteristiques attendues (or/2 8c: :att3aac+) a ete plus 
particulierement selectionne et nomme SPM107. Ce clone possede done le genotype : 
orf28c::att3aac+ et a ete nomme SPM107. II est inutile de proceder a l'excision de la 
cassette pour l'etude de l'effet de Tinactivation de orf28c, au vu de Torientation des 

30 genes (cf. figure 3). En effet, le fait que orf29 soit oriente en sens oppose a orf28c 
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montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette excisable 
permet en revanche d' avoir la possibility de se debarrasser du marqueur de selection a 
tout moment, notamment par transformation par le plasmide pOSV508. 

Afin de tester Teffet de l'extinction du gene orf28c sur la production de 
5 spiramycines, la production en spiramycines de la souche SPM107 a ete testee par la 
technique decrite dans l'exemple 15. II a ainsi pu etre demontre que cette souche 
possede un phenotype non producteur de spiramycines. Ceci demontre que le gene 
orf28c est un gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens, 

10 EXEMPLE 30 : Construction d'une souche de S. ambofaciens interrompue dans le 
gene orfil : 

L'inactivation du gene orfil a ete realisee grace a la technique des cassettes 
excisables. La cassette excisable att3aac+ a ete amplifiee par PCR en utilisant comme 
15 matrice le plasmide pSPMlOl et les oligonucleotides EDR71 et EDR72. 
EDR71: 

5 ' CGTCATCGACGTGCGGGGAAGACAGAGGTGATACCG ATGATCGCGCGC 
GCTTCGTTCGGGACGAA 3 ' (SEQ ID N° 1 57) 

20 EDR72: 

5 ' GCCAGCACCTCGTCCAGCTGCTCGACGGAACTCACCCCC ATCTGCCTCT 
TCGTCCCGAAGCAACT 3' (SEQ ID N° 1 58) 

Les 39 nucleotides situes a l'extremite 5' de ces oligonucleotides comportent une 
25 sequence correspondant a une sequence dans le gene orfil et les 26 nucleotides situes le 
plus en 3 f (figures en gras et soulignes ci-dessus) correspondent a la sequence d ! une des 
extremites de la cassette excisable attiaac+. 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
KS272 contenant le plasmide pKOBEG et le cosmide pSPM36, comme decrit par 
30 Chaveroche et al. (Chaveroche et al., 2000) (cf. figure 12 pour le principe, le plasmide 
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pOS49.99 doit etre remplace par le cosmide pSPM36 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM543). Ainsi, les bacteries ont ete transformees par electroporation 
par ce produit de PCR et les clones ont ete selectionnes pour leur resistance a 
l'apramycine. Les cosmides des clones obtenus ont ete extraits et digeres par plusieurs 
5 enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette {att3aac+) dans le gene 
or/31 , c'est a dire s'il y a bien eu recombinaison homologue entre les extremites du 
produit PCR et le gene cible. La verification de la construction peut egalement etre 
realisee par toute methode connue de l'homme du metier et notamment par PCR en 

10 utilisant les oligonucleotides appropries et sequen?age du produit de PCR. Un clone 
dont le cosmide possede le profil attendu a ete selectionne et le cosmide correspondant 
a ete nomme pSPM543. Ce cosmide est un derive de pSPM36 dans lequel or/31 est 
interrompue par la cassette att3aac+ (cf. figure 12). L'insertion de la cassette 
s'accompagne d'une deletion dans le gene or/31, l'interruption commence au niveau du 

15 trente sixieme codon de or/31. II reste apres la cassette les 33 derniers codons de or/31. 

Le cosmide pSPM543 a ete introduit dans la souche Streptomyces ambofaciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al., 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a Tapramycine. Les 

20 clones resistants a l'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec puromycine (antibiotique A) (cf. figure 
9). Les clones resistants a Tapramycine (ApraR) et sensibles a la puromycine (PuroS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene or/31 interrompu par la cassette att3aac+. Ces clones ont ete plus 

25 particulierement selectionnes et le remplacement de la copie sauvage de or/31 par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, TADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3aac+ pour 
verifier la presence de la cassette au locus attendu dans TADN genomique des clones 

30 obtenus. Une deuxieme hybridation a ete effectuee en utilisant comme sonde un 
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fragment d' ADN obtenu par PCR et correspondant a une tres large partie de la sequence 
codante du gene or/31. 

La verification du genotype peut egalement etre realisee par toute methode connue 
de Thomme du metier et notamment par PCR en utilisant les oligonucleotides 
5 appropries et sequensage du produit de PCR. 

Un clone presentant les caracteristiques attendues (or/31 ::att3aac+) a ete plus 
particulierement selectionne et nomme SPM543. H a pu en effet etre verifie grace aux 
deux hybridations que la cassette att3aac+ etait bien presente dans le genome de ce 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 

10 remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette att3aac+ dans le genome de ce clone. Ce clone 
possede done le genotype : or/31::att3aac+ et a ete nomme SPM543. H est inutile de 
proceder a l'excision de la cassette pour l'etude de 1'effet de l'inactivation de or/31, au 
vu de l'orientation des genes (cf. figure 3). En effet, le fait que or/32c soit oriente en 

15 sens oppose a or/31 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une 
cassette excisable permet en revanche d'avoir la possibility de se debarrasser du 
marqueur de selection a tout moment, notamment par transformation par le plasmide 
pOSV508. 

Afin de tester Teffet de l'extinction du gene or/31 sur la production de 
20 spiramycines, la production en spiramycines de la souche SPM543 a ete testee par la 
technique decrite dans Texemple 15. II a ainsi pu etre demontre que cette souche 
possede un phenotype non producteur de spiramycines. Ceci demontre que le gene or/31 
est un gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. 

25 EXEMPLE 31 Construction d'une souche de 5. ambofaciens interrompue dans le 
gene orJ32c : 

L'inactivation du gene orf32c a ete realisee grace a la technique des cassettes 
excisables. La cassette excisable att3aac+ a ete amplifiee par PCR en utilisant comme 
30 matrice le plasmide pSPMlOl et a l'aide des amorces suivantes : 
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KF52: 

5'GATCCGCCAGCCTCACGTCACGCCGCGCCGCCTCCCTGAC ATCGCGCGC 
GCTTCGTTCGGGACGAA 3 ! (SEQ ID N° 159). 
et KF53: 

5 5' GAGGCGGACGTCGGTACGCGGTGGGAGCCGGAGTTCGACA ATCTGCCTC 
TTCGTCCCGAAGCAACT 3' (SEQ ID N° 160). 

Les 40 nucleotides situes a Textremite 5 f de ces oligonucleotides comportent une 
sequence correspondant a une sequence dans le gene orf32c et les 26 nucleotides situes 

10 le plus en 3' (figure en gras et soulignes ci-dessus) correspondent a la sequence d'une 
des extremites de la cassette excisable att3aac+. 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
hyper-recombinante DY330 (Yu et aL, 2000) contenant le cosmide pSPM36. Ainsi, les 
bacteries ont ete transformees par electroporation par ce produit de PCR et les clones 

15 ont ete selectionnes pour leur resistance a Tapramycine. Les cosmides des clones 
obtenus ont ete extraits et digeres par l'enzymes de restriction BamHl, dans le but de 
verifier que le profil de digestion obtenu correspond au profil attendu s f il y a eu 
insertion de la cassette (att3aac+) dans le gene or/32c, c'est a dire s'il y a bien eu 
recombinaison homologue entre les extremites du produit PCR et le gene cible. La 

20 verification de la construction peut egalement etre realisee par toute methode connue de 
l'homme du metier et notamment par PCR en utilisant les oligonucleotides appropries 
et sequen9age du produit de PCR. Un clone dont le cosmide possede le profil attendu a 
ete selectionne et le cosmide correspondant a ete nomme pSPM106. Ce cosmide est un 
derive de pSPM36 dans lequel or/32c est interrompue par la cassette att3aac+. 

25 L'insertion de la cassette s'accompagne d'une deletion dans le gene or/32c, l'interruption 
commence au niveau du 112eme codon de or/3 2c. II reste apres la cassette les 91 
derniers codons de orf32c. 

Le cosmide pSPM106 a dans un premier temps ete introduit dans la souche E. coli 
30 DH5a puis, dans la souche Streptomyces ambofaciens OSC2 par transformation. Apres 
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transformation, les clones sont selectionnes pour leur resistance a Tapramycine. Les 
clones resistants a l'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec puromycine (antibiotique A) (cf. figure 
9). Les clones resistants a l'apramycine (ApraR) et sensibles a la puromycine (PuroS) 
5 sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orf32c interrompu par la cassette att3aac+. Ces clones ont ete plus 
particulierement selectionnes et le remplacement de la copie sauvage de orf32c par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, PADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
10 sur membrane et hybride avec une sonde correspondant a la cassette att3aac+ pour 
verifier la presence de la cassette dans l'ADN genomique des clones obtenus. La 
verification du genotype peut egalement etre realisee par toute methode connue de 
Thomme du metier et notamment par PCR en utilisant les oligonucleotides appropries 
et sequensage du produit de PCR. 

15 Un clone presentant les caracteristiques attendues (orf32c::att3aac+) a ete plus 

particulierement selectionne. Ce clone possede done le genotype : orf32c::att3aac+ et a 
ete nomme SPM106. II est inutile de proceder a l'excision de la cassette pour P etude de 
l'effet de Tinactivation de orf32c, au vu de l'orientation des genes (cf. figure 3). En 
effet, le fait que or/33 soit oriente en sens oppose a or/3 2c montre que ces genes ne sont 

20 pas co-transcrits. L'utilisation d'une cassette excisable permet en revanche d'avoir la 
possibilite de se debarrasser du marqueur de selection a tout moment, notamment par 
transformation par le plasmide pOSV508. 

Afin de tester Feffet de Textinction du gene orf32c sur la production de 
spiramycines, la production en spiramycines de la souche SPM106 a ete testee par la 
25 technique decrite dans Texemple 15. H a ainsi pu etre demontre que cette souche 
possede un phenotype producteur de spiramycines. Ceci demontre que le gene orf32c 
n'est pas un gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. 
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Liste des constructions decrites dans la presente demande 

Liste des abreviations : Am : Ampicilline ; Hyg: Hygromycine ; Sp : Spiramycine ; Ts : 
Thiostrepton ; Cm : Chloramphenicol. Kn : Kanamycine, Apra : apramycine. 



Nom de la 
construction 


Marqueur 
de selection 


Principales caracteristiques 


Reference 


pWE15 


Am 




(Wahl,e/a/., 1987) 


pWEDl 


Am 


pWE15 dans lequel un 
fragment Hpal-Hpal de 4.1 kb 
a ete delete 


(Gourmelen et al, 
1998) 


pOJ260 


Apra 


Conjugatif, non replicatif chez 
Streptomyces 


(Bierman et al., 
1992) 


pHP45 Qhyg 


Hyg 


Cassette SI hyg dans pHP45. 


(Blondelet-Rouault 
etal, 1997) 


pKC505 


Apra 


Cosmide 


(Richardson MA et 
al, 1987) 


pU486 


Ts 


Plasmide replicatif 
multicopies Streptomyces 


(Warded al, 1986) 


pOSint3 


Am 


ptrc-xis-int dans pTrc99A 


(Raynal etal, 1998) 


pWHM3 


Am, Ts 


Vecteur navette replicatif E. 

coli/Streptomyces. 


(Vara et al, 1989) 


pKOBEG 


Cm 




(Chaveroche et al, 
2000) 


pGP704Not 


Am 




(Chaveroche et al, 
2000) 


pMBL18 


Am 




(Nakano et al, 
1995) 


pGEM-T Easy 


Am 


vecteur E. coli pour clonage 
de produits PCR 


Mezei etal, 1994 



195 



pOS49.1 


Am 


pWEDl avec insert au niveau 
du site BamUl 


Exemple 2 


pOS49.11 


Am 


Fragment Sad de pOS49.1 
dans pUC19. 


Exemple 2 


pOSC49.12 


Ch 


Fragment Xhol de pOS49.11 
dans pBC SK+ 


Exemple 2 


pOS49.14 


Cm , Hyg 


pOSC49.12 avec le gene or/3 
interrompu par la cassette 
Qhyg 


Exemple 2 


pOS49.16 


Apra, Hyg 


Insert de pOS49.14 dans 
pOJ260 


Exemple 2 


pOS49.28 


Cm 


Fragment BamYLI-Pstl de 
3,7kb de pOS49.1 dans pBC 
SK+ 


Exemple 3 


pOS44.1 


Apra, Sp 


pKC505 contenant un insert 
conferant la resistance la 
spiramycine chez S. 
griseofuscus 


(Pernodet et al. 9 
1999) 


pOS44.2 


Ts, Sp 


Fragment Sau3Al de 1,8 kb 
pOS44.1 danspU486 


Exemple 3 


pOS44.4. 


Am 


Insert de pOS44.2 dans 
pUC19 


Exemple 3 


pSPM5 


Am 


pWEDl avec insert d'ADN de 
S. ambofaciens au niveau du 
site BamBl 


Exemple 3 


pSPM7 


Am 


pWEDl avec insert d'ADN de 
S. ambofaciens au niveau du 
site BamRl 


Exemple 3 
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pOSK1205 


Hyg 


pBK-CMV dans lequel hyg 
remplace neo 


Exemple 5 


pOS49.67 


Apra 


Fragment EcdRl-Sacl de 
pOS49. 1 , comportant une 
deletion interne de 504 
nucleotides, dans pOJ260 


Exemple 6 


pOS49.88 


Am 


Fragment de 3.7 kb Pstl- 
EcoRI de pOS49.1 dans 
pUC19 


Exemple 7 


pOS49.106 


Am 


p049.88 avec hyg dans or/S 
(hyg et or/8 dans la meme 
orientation) 


Exemple 7 


pOS49.120 


Am 


pOS49.88 avec hyg dans orfS 
(hyg et or/S dans des 
orientations opposees) 


Exemple 7 


pOS49.107 


Apra, Hyg 


Insert de pOS49.106 dans 
pOJ260 


Exemple 7 


pOS49.32 


Am, Kn 


Fragment de 1,5 kb interne a 
orfl 0 dans pCR2. 1 -TOPO 


Exemple 8 


pOS49.43 


Am, Kn 


pOS49.32 avec hyg dans or/10 
(hyg et orflO dans la meme 
orientation) 


Exemple 8 


pOS49.44 


Am, Kn 


pOS49.32 avec hyg dans orflO 
(hyg et or/10 dans des 
orientations opposees) 


Exemple 8 


pOS49.50 


Apra, Hyg 


Insert de pOS49.43 dans 
pOJ260 


Exemple 8 


pWHM3Hyg 


Am, Hyg 


pWHM3 dans lequel tsr est 
remplace par hyg 


Exemple 10 
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pOSV508 


Am, Ts 


ptrc-xis-int dans pWHM3 


Exemple 9 


pattlOhyg+ 


Cm, Hyg 


Cassette attlQhyg+ dans pBC 
SK+ dont le site Hindm a ete 
supprime 


Exemple 9 


patt30aac- 


Cm,Gn 


Cassette att3Qaac- dans pBC 
SK+ dont le site HindUI a ete 
supprime 


Exemple 9 


pOSV510 


Am, Hyg 


pro pra-Amh dans 
pWHM3Hyg 


Exemple 10 


pOS49.99 


Am 


Fragment EcoRl-BamHl de 
4,5 kb de pSPM5 dans pUC19 


Exemple 10 


pOSK1102 


Am, Apra 


pGP704Not contenant la 
cassette att3Qaac- 


Exemple 10 


pSPM17 


Am, Apra 


pOS49.99 dans lequel or/2 est 
interrompue par la cassette 
att3Slaac- 


Exemple 10 


pSPM21 


Hyg, Apra 


pOSK1205 contenant l'insert 
EcoW-Xbal de pSPM17 (dans 
lequel or/2 est interrompue 
par la cassette att3Qaac-) 


Exemple 10 


pSPM502 


Am 


Fragment BglR de 15,1 kb de 
pSPM7 dans pMBL18 


Exemple 1 1 


pSPM504 


Hyg 


Insert de pSPM502 dans 
pOSK1205 


Exemple 1 1 


pSPM507 


Hyg, Apra 


pSPM504 dans lequel orfll 
est interrompue par la cassette 
att3Qaac- 


Exemple 1 1 


pSPM508 


Hyg, Apra 


pSPM504 dans lequel orfl3c 
est interrompue par la cassette 
att3Qaac- 


Exemple 12 
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pSPM509 


Hyg, Apra 


pSPM504 dans lequel orfl4 
est interrompue par la cassette 
att3Qaac- 


Exemple 13 


pBXLllll 


Am 


Fragment de 1,11 kb 
contenant orf6* amplifie par 
PCR a partir de pSPM7, dans 
le vecteur pGEM-T Easy 


Exemple 14 


pBXL1112 


Am, Hyg 


pBXLllll dans lequel la 
cassette attlQhyg+ a ete 
introduite apres deletion de 
120 pb dans la sequence 
codante du gene orf6* 


Exemple 14 


pBXL1113 


Apra, Hyg 


Insert Pstl de 3.7 kb de 
pBXLl 112 dans pOJ260 


Exemple 14 


pSPM520 


Am 


Fragment de PCR amplifie par 
les oligonucleotides EDR39- 
EDR42 dans pGEM-T Easy 


Exemple 17 


pSPM521 


Am 


Fragment de PCR amplifie par 
les oligonucleotides EDR40- 
EDR42 dans pGEM-T Easy 


Exemple 17 


pSPM522 


Am 


Fragment de PCR amplifie par 
les oligonucleotides EDR41- 
EDR42 dans pGEM-T Easy 


Exemple 17 


pUWL201 


Am , Ts 




(Doumith et al. 9 
2000) 


pSPM523 


Am, Ts 


Fragment HindUl-BamBI de 
l'insert du plasmide pSPM520 
dans le vecteur pUWL201 


Exemple 17 
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pSPM524 


Am, Ts 


Fragment Hincffll-BamHI de 
l'insert du plasmide pSPM521 
dans le vecteur pUWL201 


Exemple 17 


pSPM525 


Am, Ts 


Fragment Hindm-BamHI de 
l'insert du plasmide pSPM522 
dans le vecteur pUWL201 


Exemple 17 


pSPM527 


Am 


pSPM521 avec decalage du 
cadre de lecture au niveau du 
site Xhol 


Exemple 17 


pSPM528 


Am , Ts 


Fragment HindTR-BamHl de 
l'insert du plasmide pSPM527 
dans le vecteur pUWL201 


Exemple 17 


pVF 10.4 






(Vara et aL, 1985; 
Lacalle etal, 1989) 


pPM803 


Ts 




(Mazodier,P. et al. 9 
1989) 


pGEM-T-/?ac- 
oriT 


Am 


Cassette pac-oriT (amplifiee 
par PCR a partir de pVF 10.4 
et pPM803) dans dans pGEM- 
TEasy 


Exemple 18 


pWED2 


Am 


Cassette pac-oriT obtenue a 
partir de pGEM-T-pac-oriT 
inseree dans pWEDl 


Exemple 1 8 


pSPM34 


Am 


pWED2 avec insert au niveau 
du site BamHL 


Exemple 19 


pSPM35 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM36 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 
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pSPM37 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM38 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM39 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM40 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM41 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM42 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM43 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM44 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM45 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM47 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM48 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPMSO 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPMSl 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 


pSPM52 


Am 


pWED2 avec insert au niveau 
du site BamHl 


Exemple 19 
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pSPM53 


Am 


pWED2 avec insert au niveau 
du site BamHI 


Exemple 19 


pSPM55 


Am 


pWED2 avec insert au niveau 
du site BamHI 


Exemple 19 


pSPM56 


Am 


pWED2 avec insert au niveau 
du site BamHI 


Exemple 19 


pSPM58 


Kn 


Fragment Pstl-Pstl d'environ 
6kb de l'insert de pSPM36 
dans pBK-CMV 


Exemple 19 


pSPM72 


Kn 


Fragment Stul-StuI d'environ 
10 kb de l'insert de pSPM36 
clone dans pBK-CMV 


Exemple 19 


pSPM73 


Cm 


Fragment EcoKL-Hindlll de 
l'insert de pSPM72 dans pBC- 
SK+ 


Exemple 19 


pSPM515 


Am 


Fragment de PCR amplifie par 
EDR31-EDR37 dans pGEM-T 
easy 


Exemple 22 


pSPM519 


Am, Ts 


Insert Hindm/Xbal de 
pSPM515dans pUWL201 


Exemple 22 


pOS49.52 


Apra 


Sequence codante de tylB sous 
controle du promoteur ermE* 
dans le plasmide pKC 1218 


Exemple 23 


pSPM74 


Am 


Fragment de PCR amplifie par 
KF30-KF31 dans pGEM-T 
easy 


Exemple 24 


pSPM75 


Am, Ts 


Insert HindmiBamHI de 
pSPM74 dans pUWL201 


Exemple 24 
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pSPM79 


Kn 


Fragment PsthPstl d' environ 
2,5kb de l'insert de pSPM36 
danspBK-CMV 


Exemple 19 


pSPM83 


Am 


Fragment de PCR amplifie par 
KF42-KF43 dans pGEM-T 
easy 


Exemple 28 


pSPM107 


Am, Apra 


pSPM36 dans lequel orf28c 
est interrompue par la cassette 
att3aac+ 


Exemple 29 


pSPM543 


Am, Apra 


pSPM36 dans lequel or/31 est 
interrompue par la cassette 
att3aac+ 


Exemple 30 


pSPM106 


Am, Apra 


pSPM36 dans lequel or/3 2c 
est interrompue par la cassette 
att3aac+ 


Exemple 31 
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Depot de materiel biologique 

Les organismes suivants ont ete deposes le 10 juillet 2002 aupres de la Collection 
Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur Roux, 75724 
Paris Cedex 15, France, selon les dispositions du Traite de Budapest. 

5 - Souche OSC2 sous le numero d'enregistrement 1-2908. 

Souche SPM501 sous le numero d'enregistrement 1-2909. 

- Souche SPM502 sous le numero d'enregistrement 1-2910. 

- Souche SPM507 sous le numero d'enregistrement 1-291 1 . 
Souche SPM508 sous le numero d'enregistrement 1-2912. 

1 0 - Souche SPM509 sous le numero d'enregistrement 1-29 1 3 . 

- Souche SPM21 sous le numero d'enregistrement 1-2914. 

- Souche SPM22 sous le numero d'enregistrement 1-2915. 

- Souche OS49.67 sous le numero d'enregistrement 1-29 1 6. 

- Souche OS49. 1 07 sous le numero d'enregistrement 1-29 1 7. 

15 - Souche Escherichia coli DH5of contenant le plasmide pOS44.4 sous le numero 
d'enregistrement 1-29 1 8. 

Les organismes suivants ont ete deposes le 26 fevrier 2003 aupres de la Collection 
Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur Roux, 75724 
Paris Cedex 15, France, selon les dispositions du Traite de Budapest. 
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Souche SPM502 pSPM525 sous le numero d'enregistrement 1-2977. 
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Les organismes suivants ont ete deposes aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 
Paris Cedex 15, France, le 6 octobre 2003 selon les dispositions du Traite de Budapest . 

- Souche OSC2/pSPM75(2) sous le numero d'enregistrement 1-3101. 

5 
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REVINDICATIONS 

1. Polynucleotide codant un polypeptide implique dans la biosynthese des 
spiramycines caracterise en ce que la sequence dudit polynucleotide est : 

5 (a) l'une des sequences SEQ ID N° 3, 5, 7, 9, 1 1, 13, 15, 17, 19, 21, 23, 25, 28, 

30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 
107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, 

(b) l'une des sequences constitutes par les variants des sequences (a), 

(c) l'une des sequences derivees des sequences (a) et (b) en raison de la 
10 degenerescence du code genetique. 

2. Polynucleotide s'hybridant dans des conditions d'hybridation de forte 
stringence a au moins l'un des polynucleotides selon la revendication 1 . 

15 3. Polynucleotide presentant au moins 70%, 80%, 85%, 90%, 95% ou 98% 

d'identite en nucleotides avec un polynucleotide comprenant au moins 10, 12, 15, 18, 
20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 
600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 
1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 ou 1900 

20 nucleotides consecutifs d'un polynucleotide selon la revendication 1 . 

4. Polynucleotide selon la revendication 2 ou 3 caracterise en ce qu'il est isole 
a partir d'une bacterie du genre Streptomyces. 

25 5. Polynucleotide selon la revendication 2, 3 ou 4 caracterise en ce qu'il code 

une proteine impliquee dans la biosynthese d'un macrolide. 



6. Polynucleotide selon la revendication 2, 3, 4 ou 5 caracterise en ce qu'il 
code une proteine ayant une activite similaire a la proteine codee par le polynucleotide 
30 avec lequel il s'hybride ou il presente l'identite. 
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7. Polypeptide resultant de Texpression d'un polynucleotide selon la 
revendication 1, 2, 3, 4, 5 ou 6. 

5 8. Polypeptide implique dans la biosynthese des spiramycines caracterisee en 

ce que la sequence dudit polypeptide est : 

(a) Tune des sequences SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 
27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 
61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 

10 121, 142, 144, 146, 148 et 150, 

(b) l'une des sequences telles que definies en (a) excepte que tout au long de 
ladite sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes 
sans en affecter les proprietes fonctionnelles, 

(c) l'une des sequences constitutes par les variants des sequences (a) et (b). 

15 

9. Polypeptide presentant au moins 70%, 80%, 85%, 90%, 95% ou 98% 
d'identite en acides amines avec un polypeptide comprenant au moins 10, 15, 20, 30 a 
40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 
360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 ou 640 acides 

20 amines consecutifs d'un polypeptide selon la revendication 8. 

10. Polypeptide selon la revendication 9 caracterise en ce qu'il est isole a partir 
d'une bacterie du genre Streptomyces. 

25 11. Polypeptide selon la revendication 9 ou 10 caracterise en ce qu'il code une 

proteine impliquee dans la biosynthese d'un macrolide. 

12. Polypeptide selon la revendication 9, 10 ou 1 1 caracterise en ce qu'il a une 
activite similaire a celle du polypeptide avec lequel il partage l'identite. 

30 
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13. ADN recombinant caracterise en ce qu'il comprend au moins un 
polynucleotide selon Tune des revendications 1, 2, 3, 4, 5 ou 6. 

14. ADN recombinant selon la revendication 13 caracterise en ce que le dit 
5 ADN recombinant est compris dans un vecteur. 

15. ADN recombinant selon la revendication 14 caracterise en ce que ledit 
vecteur est choisi parmi les bacteriophages, les plasmides, les phagemides, les 
vecteurs integratifs, les fosmides, les cosmides, les vecteurs navettes, les BAC ou les 

10 PAC. 

16. ADN recombinant selon la revendication 15 caracterise en ce qu'il est 
choisi parmi pOS49.1, pOS49.11, pOSC49.12, pOS49.14, pOS49.16, pOS49.28, 
pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67, pOS49.88, pOS49.106, 

15 pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99, 
pSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, pSPM509, pSPMl, 
pBXLllll, pBXL1112, pBXL1113, pSPM520, pSPM521, pSPM522, pSPM523, 
pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, 
pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, 

20 pSPM47, pSPM48, pSPM50, pSPM51, pSPM52, pSPM53, pSPM55, pSPM56, 
pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74, pSPM75, pSPM79, 
pSPM83, pSPM107, pSPM543 et pSPM106. 

17. Vecteur d'expression caracterise en ce qu'il comprend au moins une 
25 sequence d'acide nucleique codant un polypeptide selon la revendication 7, 8, 9, 10, 

11 ou 12. 

18. Systeme d'expression comprenant un vecteur d'expression approprie et 
une cellule hote permettant l'expression d'un ou plusieurs polypeptides selon la 

30 revendication 7, 8, 9, 10, 1 1 ou 12. 
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19. Systeme d'expression selon la revendication 18 caracterise en ce qu'il est 
choisi parmi les systemes d'expression procaryotes ou les systemes d'expression 
eucaryotes. 

5 

20. Systeme d'expression selon la revendication 19 caracterise en ce qu'il est 
choisi parmi les systemes d'expression chez la bacterie E. coli, les sytemes 
d'expression baculovirus permettant une expression dans des cellules d'insectes, les 
sytemes d'expression permettant une expression dans des cellules de levures, les 

10 sytemes d'expression permettant une expression dans des cellules de mammiferes. 

21. Cellule hote dans laquelle a ete introduit au moins un polynucleotide et/ou 
au moins un ADN recombinant et/ou au moins un vecteur d'expression selon l'une des 
revendications 1, 2, 3, 4, 5, 6, 13, 14, 15, 16 ou 17. 

15 

22. Procede de production d'un polypeptide selon la revendication 7, 8, 9, 10, 
1 1 ou 12 caracterise en ce que ledit procede comprend les etapes suivantes: 

a) inserer au moins un acide nucleique codant ledit polypeptide dans un 
vecteur approprie ; 

20 b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 

transformee ou transfectee avec le vecteur de l'etape a) ; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Pextrait cellulaire obtenu a l'etape c), ledit polypeptide ; 

25 e) le cas echeant, caracteriser le polypeptide recombinant produit. 

23. Microorganisme bloque dans une etape de la voie de biosynthese d'au 
moins un macrolide. 
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24. Microorganisme selon la revendication 23 caracterise en ce qu'il est obtenu 
en inactivant la fonction d'au moins une proteine impliquee dans la biosynthese de ce 
ou de ces macrolides dans un microorganisme producteur de ce ou de ces macrolide. 

5 25. Microorganisme selon la revendication 24 caracterise en ce que 

l'inactivation de cette ou de ces proteines est effectuee par mutagenese dans le ou les 
genes codant ladite ou lesdites proteines ou par expression d'un ou de plusieurs ARN 
anti-sens complementaires de l'ARN ou des ARN messagers codant ladite ou lesdites 
proteines. 

10 

26. Microorganisme selon la revendication 25 caracterise en ce que 
Finactivation de cette ou de ces proteines est effectuee par mutagenese par irradiation, 
par action d'agent chimique mutagene, par mutagenese dirigee ou par remplacement 
de gene. 

15 

27. Microorganisme selon la revendication 25 ou 26 caracterise en ce que la ou 
les mutageneses sont effectuees in vitro ou in situ, par suppression, substitution, 
deletion et/ou addition d f une ou plusieurs bases dans le ou les genes consideres ou par 
inactivation genique. 

20 

28. Microorganisme selon la revendication 23, 24, 25, 26 ou 27 caracterise en 
ce que ledit microorganisme est une bacterie du genre Streptomyces. 

29. Microorganisme selon la revendication 23, 24, 25, 26, 27 ou 28 caracterise 
25 en ce que le macrolide est la spiramycine. 

30. Microorganisme selon la revendication 23, 24, 25, 26, 27, 28 ou 29 
caracterise en ce que ledit microorganisme est une souche de S. ambofaciens. 
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31. Microorganisme selon la revendication 23, 24, 25, 26, 27, 28, 29 ou 30 
caracterise en ce que la mutagenese est effectuee dans au moins un gene comprenant 
une sequence selon Tune des revendication 1, 2, 3, 4, 5 ou 6. 

5 32. Microorganisme selon la revendication 25, 26, 27, 28, 29, 30 ou 31 

caracterise en ce que la mutagenese est effectuee dans un ou plusieurs genes 
comprenant une des sequences correspondant a une ou plusieurs des sequences SEQ 
ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 
60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 
10 141,143, 145, 147 et 149. 

33. Microorganisme selon la revendication 25, 26, 27, 28, 29, 30, 31 ou 32 
caracterise en ce que la mutagenese consiste en Tinactivation genique d'un gene 
comprenant une sequence correspondant a la sequence SEQ ID N° 13. 

15 

34. Souche de Streptomyces ambofaciens caracterisee en ce qu'il s'agit d'une 
souche choisie parmi : 

Tune des souches deposees aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) le 10 juillet 2002 sous le numero d'enregistrement 1-2909, 
20 1-291 1, 1-2912, 1-2913, 1-2914, 1-2915, 1-2916 ou 1-2917 
- la souche SPM5 10. 

35. Procede de preparation d'un intermediaire de biosynthese de macrolide 
caracterise en ce qu'il comprend les etapes suivantes : 

25 a) cultiver, dans un milieu de culture approprie, un microorganisme selon Tune 

des revendications 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 ou 34, 

b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a l'etape b), ledit intermediaire de biosynthese. 
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36. Procede de preparation d'une molecule derivee d'un macrolide caracterise 
en ce que Ton prepare un intermediate de biosynthese selon le procede de la 
revendication 35 et que Ton modifie 1' intermediate ainsi produit. 

5 37. Procede de preparation selon la revendication 36 caracterise en ce que Ton 

modifie ledit intermediate par voie chimique, biochimique, enzymatique et/ou 
microbiologique. 

38. Procede de preparation selon la revendication 36 ou 37 caracterise en ce 
10 que Ton introduit dans ledit microorganisme un ou plusieurs genes codant des 

proteines susceptibles de modifier Tintermediaire en s'en servant comme substrat. 

39. Procede de preparation selon la revendication 36, 37 ou 38 caracterise en 
ce que le macrolide est la spiramycine. 

15 

40. Procede de preparation selon la revendication 36, 37, 38 ou 39 caracterise 
en ce que le microorganisme utilise est une souche de S. ambofaciens. 

41. Microorganisme produisant de la spiramycine I mais ne produisant pas de 
20 spiramycine II et HI. 

42. Microorganisme selon la revendication 41 caracterise en ce qu'il comprend 
l'ensemble des genes necessaires a la biosynthese de la spiramycine I mais que le gene 
comprenant la sequence SEQ ID N° 13 ou Tun de ses variants ou Tune des sequences 

25 derivees de celles-ci en raison de la degenerescence du code genetique et codant un 
polypeptide de sequence SEQ ID N° 14 ou Tun de ses variants n'est pas exprime ou a 
ete rendu inactif. 

43. Microorganisme selon la revendication 42 caracterise en ce que la dite 
30 inactivation est realisee par mutagenese dans le gene codant ladite proteine ou par 
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l'expression d'un ARN anti-sens complementaire de TARN messager codant ladite 
proteine. 

44. Microorganisme selon la revendication 43 caracterise en ce que la dite 
5 mutagenese est effectuee dans le promoteur de ce gene, dans la sequence codante ou 

dans une sequence non codante de maniere a rendre inactive la proteine codee ou a en 
empecher son expression ou sa traduction. 

45. Microorganisme selon la revendication 43 ou 44 caracterise en ce que la 
10 mutagenese est effectuee par irradiation, par action d'agent chimique mutagene, par 

mutagenese dirigee ou par remplacement de gene. 

46. Microorganisme selon la revendication 43, 44 ou 45 caracterise en ce que 
la mutagenese est effectuee in vitro ou in situ, par suppression, substitution, deletion 

15 et/ou addition d'une ou plusieurs bases dans le gene considere ou par inactivation 
genique. 

47. Microorganisme selon la revendication 41 ou 42 caracterise en ce que ledit 
microorganisme est obtenu en exprimant les genes de la voie de biosynthese de la 

20 spiramycine sans que ceux-ci ne comprennent le gene comprenant la sequence 
correspondant a SEQ ID N° 13 ou Tun de ses variants ou Tune des sequences derivees 
de celles-ci en raison de la degenerescence du code genetique et codant un polypeptide 
de sequence SEQ ID N° 14 ou l'un de ses variants. 

25 48. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46 ou 47 

caracterise en ce que ledit microorganisme est une bacterie du genre Streptomyces. 



49. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47 ou 48 
caracterise en ce que ledit microorganisme est obtenu a partir d'une souche de depart 
30 produisant les spiramycines I, II et HI. 
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50. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47, 48 ou 49 
caracterise en ce qu'il est obtenu par mutagenese dans un gene comprenant la 
sequence correspondant a SEQ ID N° 13 ou Tun de ses variants ou Tune des 

5 sequences derivees de celles-ci en raison de la degenerescence du code genetique et 
codant un polypeptide de sequence SEQ ED N° 14 ou Tun de ses variants ayant la 
meme fonction. 

51. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47, 48, 49 ou 
10 50 caracterise en ce que ledit microorganisme est obtenu a partir d'une souche de S. 

ambofaciens produisant les spiramycines I, II et HI, dans laquelle est effectuee une 
inactivation genique du gene comprenant la sequences correspondant a SEQ ID N° 13 
ou Tune des sequences derivees de celle-ci en raison de la degenerescence du code 
genetique. 

15 

52. Souche de S. ambofaciens caracterisee en ce qu'il s'agit de la souche 
deposee aupres de la Collection Nationale de Cultures de Microorganismes (CNCM) 
le 10 juillet 2002 sous le numero d'enregistrement 1-2910. 

20 53. Procede de production de spiramycine I, caracterise en ce qu'il comprend 

les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon 
l'une des revendications 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 ou 52, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

25 (c) separer et purifier a partir dudit milieu de culture ou encore a partir de 

Pextrait cellulaire obtenu a l'etape b), la spiramycine I. 

54. Utilisation d'un polynucleotide selon Tune des revendications 1, 2, 3, 4, 5 
ou 6 pour ameliorer la production en macrolides d'un microorganisme. 

30 
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55. Microorganisme mutant producteur de macrolide caracterise en ce qu f il 
possede une modification genetique dans au moins un gene comprenant une sequence 
selon Tune des revendication 1, 2, 3, 4, 5 ou 6 et/ou qu'il surexprime au moins un 
gene comprenant une sequence selon l'une des revendication 1, 2, 3, 4, 5 ou 6. 

5 

56. Microorganisme mutant selon la revendication 55 caracterise en ce que la 
modification genetique consiste en une suppression, une substitution, une deletion 
et/ou une addition d'une ou plusieurs bases dans le ou les genes consideres dans le but 
d'exprimer une ou des proteines ayant une activite superieure ou d'exprimer un 

10 niveau plus eleve de cette ou de ces proteines. 

57. Microorganisme mutant selon la revendication 55 caracterise en ce que la 
surexpression du gene considere est obtenue en augmentant le nombre de copie de ce 
gene et/ou en pla?ant un promoteur plus actif que le promoteur sauvage. 

15 

58. Microorganisme mutant selon la revendication 55 ou 57 caracterise en ce 
que la surexpression du gene considere est obtenue en transformant un 
microorganisme producteur de macrolide par une construction d'ADN recombinant 
selon la revendication 13, 14 ou 17, permettant la surexpression de ce gene. 

20 

59. Microorganisme mutant selon la revendication 55, 56, 57 ou 58 caracterise 
en ce que la modification genetique est effectuee dans un ou plusieurs genes 
comprenant une des sequences correspondant a une ou plusieurs des sequences SEQ 
ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 

25 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 
141, 143, 145, 147 et 149, ou Tun de ses variants ou Tune des sequences derivees de 
celles-ci en raison de la degenerescence du code genetique. 

60. Microorganisme mutant selon la revendication 55, 56, 57, 58 ou 59 
30 caracterise le microorganisme surexprime un ou plusieurs genes comprenant une des 
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sequences correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 
13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 
72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 
149, ou Tun de ses variants ou Tune des sequences derivees de celles-ci en raison de 
5 la degenerescence du code genetique. 

61. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59 ou 60 
caracterise en ce que ledit microorganisme est une bacteries du genre Streptomyces. 

10 62. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59, 60 ou 61 

caracterise en ce que le macrolide est la spiramycine. 

63. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59, 60, 61 ou 
62 caracterise en ce que ledit microorganisme est une souches de S. ambofaciens. 

15 

64. Procede de production de macrolides, caracterise en ce qu'il comprend les 
etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon 
l'une des revendications 55, 56, 57, 58, 59, 60, 61, 62, 63 ou 64, 
20 (b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Pextrait cellulaire obtenu a l'etape b), le ou lesdits macrolides produits. 

65. Utilisation d'une sequence et/ou d'un ADN recombinant et/ou d'un vecteur 
25 selon Tune des revendication 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 ou 17 

pour la preparation d'antibiotiques hybrides. 



66. Utilisation d'au moins un polynucleotide et/ou au moins un ADN 
recombinant et/ou au moins un vecteur d'expression et/ou au moins un polypeptide 
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et/ou au moins une cellule hote selon Tune des revendications 1, 2, 3, 4, 5, 6, 7, 8, 9, 
10, 11, 12 13, 14, 15, 16, 17 ou21 pour realiser une ou plusieurs byconversions. 

67. Polynucleotide caracterise en ce qu'il s'agit d'un polynucleotide 
5 complementaire de l'un des polynucleotides selon la revendication 1, 2, 3, 4, 5, ou 6. 

68. Microorganisme producteur d'au moins une spiramycine caracterise en 
ce qu'il surexprime : 

-un gene susceptible d'etre obtenu par amplification en chaine par 
polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
10 AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

-ou un gene derive de celui-ci en raison de la degenerescence du code 
genetique. 

15 69. Microorganisme selon la revendication 68 ou 90 caracterise en ce qu'il 

s'agit d'une bacterie du genre Streptomyces. 

70. Microorganisme selon la revendication 68, 69 ou 90 caracterise en ce 
qu'il s'agit d'une bacterie de l'espece Streptomyces ambofaciens. 

71. Microorganisme selon la revendication 68, 69, 70 ou 90 caracterise en 
20 ce que la surexpression dudit gene est obtenue par transformation dudit 

microorganisme par un vecteur d 'expression. 

72. Souche de Streptomyces ambofaciens caracterisee en ce qu'il s'agit de la 
souche OSC2/pSPM75(l) ou de la souche OSC2/pSPM75(2) deposee aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, 

25 rue du Docteur Roux 75724 Paris Cedex 15, France, le 6 octobre 2003 sous le 
numero d'enregistrement 1-3101. 

73. ADN recombinant caracterise en ce qu'il comprend : 
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un polynucleotide susceptible d'etre obtenu par amplification en chaine par 
polymerase en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
5 matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

ou, un fragment d'au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 
90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 
900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 
1470, 1480, 1490 ou 1500 nucleotides consecutifs de ce polynucleotide. 

10 74. ADN recombinant selon la revendication 73 ou 91 caracterise en ce 

qu'il s'agit d'un vecteur. 

75. ADN recombinant selon la revendication 73, 74 ou 91 caracterise en ce 
qu'il s'agit d'un vecteur d'expression. 

76. Cellule hote dans laquelle a ete introduit au moins un ADN recombinant 
15 selon l'une des revendications 73, 74, 75 ou 91. 

77. Procede de production d'un polypeptide caracterise en ce que ledit 
procede comprend les etapes suivantes: 

a) transformer une cellule hote par au moins un vecteur d'expression selon la 
revendication 75; 

20 b) cultiver, dans un milieu de culture approprie, ladite cellule hote; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a l'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 



25 78. Microorganisme selon la revendication 51 caracterise en ce que 

Finactivation genique est effectuee par deletion en phase du gene ou d'une partie 
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du gene comprenant la sequence correspondant a SEQ ED N° 13 ou Tune des 
sequences derivees de celle-ci en raison de la degenerescence du code genetique. 

79. Microorganisme selon Tune des revendications 41, 42, 43, 44, 45, 46, 
47, 48, 49, 50, 51 ou 78 caracterise en ce en ce qu'il surexprime en outre : 

5 un gene susceptible d'etre obtenu par amplification en chaine par 

polymerase en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 
10 - ou un gene derive de celui-ci en raison de la degenerescence du code 

genetique. 

80. Vecteur d'expression caracterise en ce que le polynucleotide de 
sequence SEQ ED N° 47 ou un polynucleotide derive de celui-ci en raison de la 
degenerescence du code genetique est place sous le controle d'un promoteur 

15 permettant 1' expression de la proteine codee par le dit polynucleotide chez 
Streptomyces ambofaciens. 

81. Vecteur d'expression selon la revendication 80 caracterise en ce qu'il 
s'agit du plasmide pSPM524 ou pSPM525. 

82. Souche de Streptomyces ambofaciens transformee par un vecteur selon 
20 la revendication 80 ou 8 1 . 

83. Microorganisme selon l'une des revendications 41, 42, 43, 44, 45, 46, 
47, 48, 49, 50, 51, 78, 79 ou 92 caracterise en ce qu'il surexprime en outre le gene 
de sequence codante SEQ ID N° 47 ou d'une sequence codante derivee de celle-ci 
en raison de la degenerescence du code genetique. 

25 84. Microorganisme selon la revendication 83 caracterise en ce qu'il s'agit 

de la souche SPM502 pSPM525 deposee aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
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75724 Paris Cedex 15, France, le 26 fevrier 2003 sous le numero cTenregistrement 
1-2977. 

85. Procede de production de spiramycine(s), caracterise en ce qu'il 
comprend les etapes suivantes : 
5 (a) cultiver, dans un milieu de culture approprie, un microorganisme selon 

l'une des revendications 68, 69, 70, 71, 72, 78, 79, 82, 83, 84, 90 ou 92, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a l'etape b), les spiramycines. 

10 86. Polypeptide caracterise en ce que sa sequence comprend la sequence SEQ 

ID N° 1 12 ou la sequence SEQ ID N° 142. 

87. Polypeptide caracterise en ce que sa sequence correspond a la sequence 
traduite de la sequence codante : 

- d'un gene susceptible d'etre obtenu par amplification en chaine par 
15 polymerase (PCR) en utilisant le couple d'amorces de sequence suivante : 5' 
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3 s (SEQ ID N° 138) et 5' 
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N° 139) et comme 
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, 

-ou d'un gene derive de celui-ci en raison de la degenerescence du code 
20 genetique. 

88. Vecteur d'expression permettant l'expression d'un polypeptide selon la 
revendication 86, 87 ou 93 chez Streptomyces ambofaciens. 

89. Vecteur d'expression selon la revendication 88 caracterise en ce qu'il 
s'agit du plasmide pSPM75. 



25 90) Microorganisme selon la revendication 68 caracterise en ce que le gene 

susceptible d'etre obtenu par amplification en chaine par polymerase est le gene de 
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sequence codante SEQ ID N° 141 ou un gene derive de celui-ci en raison de la 
degenerescence du code genetique. 

91) ADN recombinant selon la revendication 73 caracterise en ce que le 
polynucleotide susceptible d'etre obtenu par amplification en chaine par 
polymerase est un polynucleotide de sequence SEQ ID N° 141 . 

92) Microorganisme selon la recendication 79 caracterise en ce que le gene 
susceptible d'etre obtenu par amplification en chaine par polymerase est le gene de 
sequence codante SEQ ID N° 141 ou un gene derive de celui-ci en raison de la 
degenerescence du code genetique. 



93) Polypeptide caracterise en ce que sa sequence est SEQ ID N° 142. 
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BREVET D'INVENTION 



Polypeptides impliques dans la biosynthese pes spiramycines. 
sequences nucleotidiques codant ces polypeptides et leur 

utilisation 



AVENTIS PHARMA SA. 
CNRS 

ABREGE 



La presente invention concerne l'isolement et Identification de nouveaux genes 
de la voie de biosynthese des spiramycines et de nouveaux polypeptides impliques 
dans cette biosynthese. L'invention est egalement relative a un procede de production 
de ces polypeptides. Elle est egalement relative a 1'utilisation de ces genes dans le but 
d'augmenter les taux de production et la purete de la spiramycine produite. L'invention 
concerne notamment un microorganisme produisant de la spiramycine I mais ne 
produisant pas de spiramycine II et HI et 1'utilisation d'un tel micoorganisme. 
L'invention a egalement trait a 1'utilisation des genes de la voie de biosynthese des 
spiramycines pour la construction de mutants pouvant conduire a la synthese de 
nouveaux antibiotiques ou a des formes derivees de spiramycines. L'invention 
concerne encore les molecules produites grace a l'expression de ces genes et des 
compositions pharmacologiquement actives d'une molecule produite grace a 
l'expression de tels genes. 



